ジニ係数の計算
芳沢(2014)に、ジニ係数の計算が紹介されているので、より一般的な式に直して、ここにも書き残しておきます。以前、 note に書いた記事と同一内容です。 note では、一部の数式がちゃんと表示されていなかったのですが、ここではちゃんと見えるといいなあ。参考にしたのはこちらの書籍の第8章第2節 「確率と統計」です。
www.hanmoto.com
事例
社員が4人の架空企業の給与配分だと思ってみてください。Aさんが300万、Bさんが400万、Cさんが500万、Dさんが800万。折れ線グラフ縦軸は、給与の累積額を表していることに注意してください。図(イ)で塗りつぶされた部分の面積の、三角形ODHに対する割合がジニ係数です。以下、データ点(図中のA~D)を として、芳沢が示している計算式を再現します。
(1) 三角形ODHの面積
三角形の面積は、「底辺×高さ÷2」です。
底辺が、高さが、よって面積はです。
(2) 多角形OABCDHの面積
三角形1つと台形3つに分けて計算します。台形の面積は「(上底+下底)×高さ÷2」でした。
- 三角形OAE:
- 台形AEFB:
- 台形BFGC:
- 台形CGHD:
合計すると、になります。このとき、の係数が、奇数の列になっていることに注目しましょう。
(3) 塗りつぶされた部分(多角形OABCD)の面積
三角形ODHの面積(1)から、多角形OABCDHの面積(2)を引きます。
の係数に注目しましょう。絶対値でみると左右対称です。の添え字が大きい側がプラス、小さい側がマイナスです。例題ではが4つですが、3つの場合、5つの場合など、試してみると、かならずこのような形になります。(奇数個の場合、たとえばが1~3のとき、の係数は0になります。)
(4) ジニ係数
多角形OABCDの面積(3)が、三角形ODHの面積(1)の何%にあたるかを計算します。が両方にあるので約分できますから、
これがジニ係数です。ここから先は、に具体的に数値をあてはめないと計算できません。数値が大きくなりすぎるので、以下はで計算しましょう。
(5) 数値をあてはめて
となりました。ジニ係数は、0~1の値をとり、資源が完全に平等に分配されているときに0、資源を誰かが完全に独り占めしているときに1になります。要するに、数値が大きいほど格差が大きく、小さいほど平等に近いわけですね。例題では0.2ですから、比較的平等に近い感じでしょうか。
一般化すると
(a) 多角形OABCDの面積
ところで、上記(3)で計算した多角形OABCDの面積は、データ同士の差の合計と一致することが知られています。次の式を見てください。(注:のようにソートされているとします。)
これを縦に合計していくと、(3)で求めたのカッコ内と一致しますね。の部分は、割り算するときにいずれ消えるので、なくてもかまいません。
さらに、係数が添え字とnから計算できるので、次のように書き換えられます。
ここで、はデータサイズ、あるいは度数分布表の階級数です。
(b) 三角形ODHの面積
また、(1)で求めた三角形ODHの面積は、次のように変形できます。
やはりの部分は、割り算するときにいずれ消えるので消しておきます。よって、として使います。
(c) ジニ係数
上記(4)でやったように、多角形OABCDの面積÷三角形ODHの面積ですから、
となります。