当前位置:文档之家› 基尼系数的计算方法

基尼系数的计算方法


SB=∫10 mpndp= m n+1
式(6)
计算
G= SA = SA+B-SB =1- 2m
SA+B
SA+B
n+1
式(7)
拟合曲线法的在两个环节容易产生谬误:一是拟合洛伦茨曲线,得出函数表达式的过 程中,可能产生误差;二是拟合出来的函数应该是可积的,否则就无法计算。
3、分组计算法 这种方法的思路有点类似用几何定义计算积分的方法,在 X 轴上寻找 n 个分点,将洛 伦茨曲线下方的区域分成 n 部分,每部分用以直代曲的方法计算面积,然后加总求出面积。 分点越多,就越准确,当分点达到无穷大时,则为精确计算。
n
∑Yi
这是精确计算基尼系数的表达式,当分点 n 个数有限时,定义:
yi=
Yi
n
∑Yi
得到近似表达式:
式(9) 式(10)
G=2SA=
2 n
(y1+2y2+···+nyn)-(
n+1 ) n
式(11)
(证明过程见附录二)
分组计算法不依赖于洛伦茨曲线的函数形式,但在以直代曲的环节会出现误差,增加
分点的个数可以减少这种误差。
式(12)地意义在于形式化地表述了对总体基尼系数进行分解的思路和框架,但由于没
3
发展经济学论文
有给出 Wi、Ib 和ε(fi)的具体计算方法,还不能用于基尼系数的计算。 经济学家 Sundrum(1990)在他的《欠发达国家的收入分配》一书中介绍了一种对一国
或地区基尼系数进行分解的方法,其数学公式为:
n
∑Yi
SP=21
AB(AC+BD)= 1 2n
i-1
i
∑ Yi+∑ Yi
n
∑Yi
i
=1 2n

∑Yi
n
∑Yi

i-1
∑ Yi
n

∑Yi
n
SB=∑
1 2n
i-1
i
∑ Yi+∑ Yi
n
∑Yi
SA=SA+B-SB=21
n
-∑
1
2n
i-1
i
∑ Yi+∑ Yi
n
∑Yi
=1 2n
n
n i-1
i
n∑Yi-(∑ ∑ Yi+∑ Yi)
这种方法会在可能在两个环节产生误差:一是用其他方法估计城乡各自的基尼系数 G1 和 G2 时,可能产生误差;二是城乡收入分布一般会在不同程度上重叠。
附录一: 证明:G=△/2u=2SA第一步,分解Fra biblioteknn ∑∑
Yj-Yi∣
j=1 i=1∣
设将收入按从低到高排列 Y1、Y2、……Yn,则上式可以分解为矩阵 A:
n
n i-1
i
n∑Yi-∑ ∑ Yi+∑ Yi
n
∑Yi
n
n i-1
i
分解n∑Yi-∑ ∑ Yi+∑ Yi 得到矩阵 B
n
n∑Yi Y1+Y2+…Yn Y1+Y2+…Yn

n i-1
i
∑ ∑ Yi+∑ Yi
+Y1 Y1+Y1+Y2
Y1+Y2+Y1+Y2+Y3

n
n i-1
i
n∑Yi-∑ ∑ Yi+∑ Yi
P
O
Xi-1 Xi
Xn X
图三
P
A
B
i-1
i
图四
如图四,计算每一部分面积 SP
SP=21
AB(AC+BD)= 1 2n
i-1
i
∑ Yi+∑ Yi
n
∑Yi
n
SB=∑
1 2n
i-1
i
∑ Yi+∑ Yi
n
∑Yi
第四步,计算 SA
SA=SA+B-SB=21
n
-∑
1
2n
i-1
i
∑ Yi+∑ Yi
n
∑Yi
=1 2n
了样本数据的基尼系数值。
2、拟合曲线法
拟合曲线法计算基尼系数的思路是采用数学方法拟合出洛伦茨曲线,得出曲线的函数
表达式,然后用积分法求出 B 的面积,计算基尼系数。通常是通过设定洛伦茨曲线方程,
用回归的方法求出参数,再计算积分。例如,设定洛伦茨曲线的函数关系式为幂函数:
I=αPβ
式(5)
根据选定的样本数据,用回归法求出洛伦seo茨曲线,例如,α=m,β=n.求积分
4、分解法
上述的计算方法的最终目的都在于求出基尼系数的值,而分解法则是在求出上述值的
基础上,力图研究基尼系数的构成因素,除了得出总的基尼系数的信息之外,在计算过程中
还能够获得分解部分内部的基尼系数值。另外,分解法求出基尼系数的过程一般都依赖于已
有部分的基尼系数的值,从这个意义上说,分解法并不是独立计算基尼系数的方法,它更重
2
Y E
发展经济学论文
C
A B
P
O
X
图二
假设分为 n 组,每组的收入为 Yi,则每个部分 P 的面积为:
SP=
1 2n
i-1
i
∑ Yi+∑ Yi
n
∑Yi
加总得到:
式(8)
G= SA SA+B
= SA+B-SB SA+B
n
=1-2lim ∑ 1 k→∞ 2n
i-1
i
∑ Yi+∑ Yi
ni
n
(2n-2 ∑∑yi+2∑yi)-
n+1 2n
=1 n
(y1+2y2+···+nyn)-
n+1 2n
G=2SA=
2 n
(y1+2y2+···+nyn)-(
n+1 ) n
参考资料: 1、 Sundrum.R.M,1990,Incom Distribution in Less Developed Counties, London and New
j=1 i=1∣
式(4)
直接计算法只涉及居民收入样本数据的算术运算,很多学者认为理论上看,只要不存
在来源于样本数据方面的误差,就不存在产生误差的环节。实际上,在附录一证明过程当中
将看到,直接计算法依然采用了以直代曲法计算面积,只不过这个过程在样本数据范围内达
到了最小近似,其精确度直接取决于样本数据本身。因此,可以认为它不带任何误差的计算
York:Routledge 2、 Cowell.F.A,2000,Measurement of Inequality, in Handbook of Income Distribution,
eds. By A.Atkirrson and F.Bourguignon, Northholland 3、 熊俊:《基尼系数估算方法的比较研究》;《财经问题研究》2003 年 1 月第 1 期 4、 王文森:《基尼系数及推广应用》;《统计与预测》;2003 年 1 月第 1 期
Y
E
C
A B
O
X
图一
为了用指数来更好的反映社会收入分配的平等状况,1912 年,意大利经济学家基尼根 据洛伦茨曲线计算出一个反映收入分配平等程度的指标,称为基尼系数(G)。在上图中, 基尼系数定义为:
G= SA SA+B
式(1)
当 A 为 0 时,基尼系数为 0,表示收入分配绝对平等;当 B 为 0 时,基尼系数为 1,表
发展经济学论文
基尼系数的计算方法及数学推导
2001 金融三班 袁源
摘要:本文归纳了基尼系数的四种计算方法:直接计算法、拟合曲线法、分组计算法和分解 法,并进行了数学推导和证明。在此基础上,文章比较了各种算法优缺点,分析了误 差可能产生的环节。
关键词:洛伦茨曲线 基尼系数
一、洛伦茨曲线和基尼系数
1905 年,统计学家洛伦茨提出了洛伦茨曲线,如图一。将社会总人口按收入由低到高 的顺序平均分为 10 个等级组,每个等级组均占 10%的人口,再计算每个组的收入占总收入 的比重。然后以人口累计百分比为横轴,以收入累计百分比为纵轴,绘出一条反映居民收入 分配差距状况的曲线,即为洛伦茨曲线。
Yn+Yn-1+…Y2
Yn+Yn-1+…Y3-Y1 Yn+Yn-1+…Y4-Y1-Y2

Y1+Y2+…Yn Y1+Y2+…Yn-2+Y1+Y2+…Yn-1 Y1+Y2+…Yn Y1+Y2+…Yn-1+Y1+Y2+…Yn
Yn-Y1-Y2-…Yn-2 -Y1-Y2-…Yn-1
5
发展经济学论文
加总最后一行,得到:
P22 u2 u
G2 可以作为以P12
u1 u
和P22 u2 u
k
为权重的∑WiGi,P1P2︱
u1-u2 u
︱则为组间差距指
数Ib。值得注意的是式中没有ε(fi)项,意味着ε(fi)=0 成立,因此这种算法隐含的假
设条件是农村与城镇的收入分布完全不重叠。此外,采用这种计算方法还必须满足条件:在
估算城乡内部的基尼系数时所用的居民收入数据的口径是相同或相近的。
n
∑Yi
n
n
i
n
n
i
=1 2n
n∑Yi-∑(2
∑ Yi-Yi)
n
∑Yi
=1 2n
n∑Yi-∑(2 ∑ Yi-Yi)
n
∑Yi
=1
ni
n
(2n-2 ∑∑yi+2∑yi)-
n+1
2n
2n
ni
分解 n- ∑∑yi 得到矩阵 C:
n
y1+y2+……yn y1+y2+……yn
ni
∑∑yi
y1 y1+y2 y1+y2+y3
第二步,计算
相关主题