当前位置:
文档之家› 基尼系数的计算方法与中国的基尼系数估计
基尼系数的计算方法与中国的基尼系数估计
基尼系数的计算方法与中国的基尼系数估计
文/更远大侠 基尼系数是 20 世纪初意大利经济学家基尼,根据劳伦茨曲线所定义的判断 收入分配公平程度的指标。是比例数值,在 0 和 1 之间,是国际上用来综合考察 居民内部tm) 基尼系数是反映一组数据离散程度的指标,其功能类似于标准差。基尼系数 (或标准差)越大,那么平均指标(以平均数为代表,还包括中位数与众数)对 于一组数据的代表性越差;基尼系数(或标准差)越小,则平均指标对于一组数 据的代表性越好。(参见任何一本统计学教材) 基尼系数的计算依赖于洛伦茨曲线。下面先介绍洛伦茨曲线,再介绍基尼系 数的计算。
三、基尼系数的定义
基尼系数定义为洛伦茨曲线与绝对平均线之间的面积与三角形 OKE 面积的 比例。如图 3 所示:
洛伦茨曲线
100 90 80 70
绝对平均线 洛伦茨曲线
E J H G F A
20
财富比例
60 50 40 30 20 10
X C
D Y K
80 100
B
40 60
O0
0
人口比例
基尼系数=X/(X+Y)=OABCDEJHGFO 的面积/三角形 OKE 的面积 显然,基尼系数应该在[0,1]这个区间之中。当洛伦茨曲线是绝对平均线时, 洛伦茨曲线与绝对平均线围成的面积就是 0,从而此时基尼系数等于 0,这就是 财富绝对平均分配时的基尼系数。当财富分配绝对不平等,即所有财富只集中在 一个人手里时,洛伦茨曲线就是折线 OKE,这时候的基尼系数就等于 1,因为这 时候洛伦茨曲线与绝对平均线之间的面积就等于三角形 OKE 的面积了。
700
X
A B
300
O
0在上图中,已知“0.4%的中国人占有 70%的财富”,则洛伦茨曲线为 OAE 折 线。其中 A 点坐标为(996,300),E 点坐标为(1000,1000)。为计算基尼系 数,先计算三角形 OCA、三角形 ABE 与矩形 ACKB 的面积。 三角形 OCA 的面积=996×300/2=149400 三角形 ABE 的面积=700×4/2=1400 矩形 ACKB 的面积=300×4=1200 从而洛伦茨曲线下方的面积=149400+1400+1200=152000 而三角形 OKE 的面积=1000×1000/2=500000 从而洛伦茨曲线与绝对平均线之间围成的面积=500000-152000=348000 从而基尼系数 g=348000/500000=0.696 因此,可以知道,中国在 2009 年的实际基尼系数应该大于 0.696。上面已 经说过,只通过一个数据所估算的基尼系数要小于实际的基尼系数。 二〇一〇年十月二十六日 10 时 29 分 21 秒
1 n 1 1 甲国的基尼系数 g1 1 (2 Wi 1) 1 [2(0.03 0.11 0.21 0.36) 1] n i 1 5
=1-0.2[2×0.71+1]=1-0.2×2.42=0.516
1 n 1 1 乙国的基尼系数 g2= 1 (2 Wi 1) 1 [2(0.05 0.17 0.32 0.52) 1] n i 1 5
于是 X=0.5-Y 故基尼系数 g=X/0.5=2X=2(0.5-Y)=1-2Y
2 1 1 n 1 1 (W1 W2 Wn 1 ) 1 (2 Wi 1) n 2 n i 1
例:以表 2 所示数据为例,计算甲国与乙国的基尼系数。 人口百比分 每组人口百分比 甲国每组财富所占百分比 甲国向上累计财富百分比 乙国每组财富所占百分比 乙国向上累计财富百分比 0-20 0.2 3 3 8 5 20-40 0.2 8 11 12 17 40-60 0.2 10 21 15 32 60-80 0.2 15 36 20 52 80-100 0.2 64 100 48 100
从而所知数据越少,估算的基尼系数与真实的基尼系数相比,将会变得更小。从 而,从理论上讲,知道一个数据所估计的基尼系数将大大小于真实的基尼系数。 下面以中国的财富分配数据为例来说明这一点。 据中国社会科学院研究结果,在 2009 年“0.4%的中国人占有 70%的财富”, 以此为关键词在网络上搜索可以得到大量这方面的报道。 由此可知,低收入群体的 99.6%的人口只占有中国财富总量的 30%。为了方 便起见,下面以 1000 作为坐标正方形的边长。画出洛m
个人时,其增加的边际财富比例是增递的,边际财富比例递增,即表现为洛伦茨 曲线是向下凸的曲线。在连续近似的情况下,相当于洛伦茨曲线的二阶导数大于 0。
洛伦茨曲线
100 90 80 70
绝对平均线 洛伦茨曲线
E J H G F A
0-20 3 3
也就是说,最少财富的 20%人口,只占有 3%的财富;而最少财富的 40%人口 中,只占有 11%的财富;最少财富的 60%人口,只占有 21%的财富;最低财富的 80%人口占有财富比例为 36%;当然最后 100%的人口占有财富 100%。 于是就可以描绘出洛伦茨曲线的六个点,O(0,0),A(20,3),B(40,11), C(60,21),D(80,36),E(100,100)。如图 1 所示,折线 OABCDE 就是洛伦 茨曲线。 洛伦茨曲线通常是一条向下凸的曲线。为什么,因为人口是按照财富从低到 高排列的,排在右边的人的财富总是大于或等于左边的人的财富。于是每增加一
20
财富比例
60 50 40 30 20 10
D C
B K
40 60 80 100
O0
0
人口比例
二、洛伦茨曲线与财富分配
一个社会财富分配的不同状况对应于不同的洛伦茨曲线,可以证明,贫富分 化越大,则洛伦茨曲线曲线的位置越低;贫富分化程度越小,则洛伦茨曲线曲线 的位置越高;如果财富在人们之间完全平均分配,那么洛伦茨曲线曲线就是直线 段 OFGHJE,这时候财富比例与人口比例同等程度地增长。 为了理解洛伦茨曲线的位置与贫富分化的关系, 下面假设有两个国家甲国与 乙国。其人口按照财富从低到高排列的情况如表 2 所示。图 2 画出了甲国与乙国 两个国家的洛伦茨曲线。 表2 人口百比分 甲国每组财富所占百分比 甲国向上累计财富百分比 乙国每组财富所占百分比 乙国向上累计财富百分比 两个国家财富分配的假设数据 0-20 3 3 8 5 20-40 8 11 12 17 40-60 10 21 15 32 60-80 15 36 20 52 80-100 64 100 48 100
Y W Wn P1W1 W W2 P2 1 Pn n 1 2 2 2
;其向上累计的比重分别为
W1(=w1)、W2、…、Wi、…、Wn=1。则洛伦茨曲线下方与折线 OKE 围成的面积
当人口比重相同时,Pn=1/n,则
Y Pn (
W Wn W1 W1 W2 1 1 n 1 ) (W1 W2 Wn 1 ) 2 2 2 n 2
四、基尼系数的计算
通常情况下,知道了一些财富分配的数据,便可以画出洛伦茨曲线,从而可 以采用几何方法算出洛伦茨曲线与绝对平均线之间的面积, 进而可以求出基尼系 数。可以先求出洛伦茨曲线下方与折线 OKE 之间的面积,然后用三角形 OKE 的面 积减去这个面积就得到洛伦茨曲线与绝对平均线所围成的面积了。 设人口按照财富从低到高排列,其人口分组比重分别为 P1、P2、…、Pi、…、 Pn。每组财富比重依次为:w1、w2、…、wi、…、wn 应该为:
=1-0.2[2×1.06+1]=1-0.2×3.12=0.376 这验证了前面得出的结论——甲国的基尼系数比乙国的基尼系数大。
五、基尼系数与标准差计算的比较
基尼系数的计算不同于标准差的计算。 标准差的计算通常需要全部的数据信 息,而基尼系数的计算则只需要少量分组比重信息就可以估算。比如即使知道一 个财富分配的比例数据,也可以估算基尼系数。因为,只要知道洛伦茨曲线上不 同于两个端点 O 点与 E 点的任意一个点, 那么就可以把这个点与原点 O 与右上角 的项点 E 点连成一个折线, 从而这个折线就是已知这一个数据而形成的洛伦茨曲 线。如果知道更多的数据,那么这个折线可以画得更详细,但是容易证明,那就 是,假设已知数据之间不包含矛盾,那么当一个分组数据集 M 是另一个分组数据 集 N 的子集时,那么穿过数据集 N 的洛伦茨曲线也穿过数据集 M 的洛伦茨曲线, 穿过数据集 M 的洛伦茨曲线构成穿过数据集 N 的洛伦茨曲线的一个子集。 并且穿 过数据集 N 的洛伦茨曲线位于穿过数据集 M 的洛伦茨曲线的下方。 从而所知数据 越少,所画的洛伦茨曲线的近似折线与绝对平均线即 45 度线之间的面积越小,
洛伦茨曲线
100 90 80 70
绝对平均线 甲国洛伦茨曲线 乙国洛伦茨曲线
E J H G
C2 D2 D1 C1 A2
20
财富比例
60 50 40 30 20 10
F
A1
B2 B1
40 60 80
O0
0
K
100
人口比例
可以看到,甲国的财富分化从直观上看比乙国的财富分化要大,因而其洛伦 茨曲线的位置比乙的洛伦茨曲线位置要低。 因此,可以预测,贫富分化越大,则其洛伦茨曲线与绝对平均张 OE 之间围 成的面积越大;反之,贫富分化越小,则其洛伦茨曲线与绝对平均张 OE 之间围 成的面积越小。 因此, 观察洛伦茨曲线与绝对平均张 OE 之间的面积占三角形 OKE 的比例,就可以大致确定一个国家的贫富分化程度,这就是基尼系数。
一、洛伦茨曲线
洛伦茨曲线是在一个横坐标为人数比例、纵坐标为财富(或收入)比例的坐 标系中的一条曲线。我们假设一个国家或地区的人口,按照财富从低到高的顺序 从左到右排列, 然后以财富从低到高的顺序分别统计向上累计人口比例与其所占 财富比例,并将这两个数据分别作为横坐标与纵坐标画在坐标系中。 为简单计,我们假设有下面表 1 的数据。 表1 人口百比分 每组财富所占百分比 向上累计财富百分比 某国家财富分配的假设数据 20-40 8 11 40-60 10 21 60-80 15 36 80-100 64 100