E X C E L计算基尼系数法
简单实用
The latest revision on November 22, 2020
收入差距基尼系数的EXCEL算法
一、理论背景
为了研究国民收入在国民之间的分配问题,美国统计学家(或说奥地利统计学家).洛伦兹(Max Otto Lorenz,1903- )1907年(或说1905年)提出的了着名的洛伦兹曲线。
它先将一国人口按收入由低到高排队,然后考虑收入最低的任意百分比人口所得到的收入百分比。
将这样的人口累计百分比和收入累计百分比的对应关系描绘在图形上,即得到洛伦兹曲线。
洛伦兹曲线用以比较和分析一个国家在不同时代或者不同国家在同一时代的财富不平等,该曲线作为一个总结收入和财富分配信息的便利的图形方法得到广泛应用。
图1中横轴OH表示人口(按收
入由低到高分组)的累积百分比,
纵轴OM表示收入的累积百分比,弧
线OL为洛伦兹曲线。
洛伦兹曲线的弯曲程度有重要
意义。
一般来讲,它反映了收入分
配的不平等程度。
弯曲程度越大,
收入分配越不平等,反之亦然。
特
别是,如果所有收入都集中在1人
图1
手中,而其余人口均一无所获时,
收入分配达到完全不平等,洛伦兹曲线成为折线OHL。
另一方面,若任一人口百分比均等于其收入百分比,从而人口累计百分比等于收入累计百分比,则收入分配是完全平等的,洛伦兹曲线成为通过原点的45度线OL。
一般来说,一个国家的收入分配,既不是完全不平等,也不是完全平等,而是介于两者之间。
相应的洛伦兹曲线,既不是折线OHL,也不是45度线OL,而是像图中这样向横轴突出的弧线OL,尽管突出的程度有所不同。
将洛伦兹曲线与45度线之间的部分A 叫做“不平等面积”,当收入分配达到完全不平等时,洛伦兹曲线成为折线OHL ,OHL 与45度线之间的面积A+B 叫做“完全不平等面积”。
不平等面积与完全不平等面积之比,成为基尼系数,是衡量一国贫富差距的标准。
基尼系数G=A/(A+B)。
显然,基尼系数不会大于1,也不会小于零。
二、计算原理
网上有很多文章对基尼系数的计算方法有着深入的探讨,但都公式复杂吓人,涉及到积分、协方差等概念的运用,不易理解和操作,令人望而却步。
本文提出的是样本区间微分面积离散累积法,完全通俗易懂,在EXCEL 中只利用四则运算就能得出非常精确的结果。
以图2为例:
——条件1:ODGF 围成一个长方
形,其中D 在OH 轴的40%位置(表示
累计人数占总人数的40%),F 在OM
轴的10%位置(表示累计收入占总收
入的10%),G 为洛伦兹曲线上的一个
点,代表着累计40%的人群的累计收
入占总收入的10%,G 的坐标为
(40%,10%)
——条件2:OPRK 围成一个长方
形,其中P 在OH 轴的60%位置(表示
累计人数占总人数的60%),K 在OM 轴的30%位置(表示累计收入占总收入的30%),R 为洛伦兹曲线上的一个点,代表着累计60%的人群的累计收入占总收入的30%,R 的坐标为(60%,30%)
——微分面积计算:根据上述条件,直角梯形DPGR 的面积S=(DG+PR )×DP ÷2,则具体面积为:(10%+30%)×(60%-40%)÷2=
——面积B 计算:将每个直角梯形的面积累加,即为面积B 的值
——面积A 计算:将直角三角形OHL 的面积(即1×1÷2=)减去面积B ——基尼系数计算:面积A ÷直角三角形OHL 的面积
三、测算步骤
D F K P
R
图2
1、将已知样本数据(工资收入数值)在EXCEL表中按照从小到大自动排序,形成第一列数据,字段名称“工资排序”
2、第二列数据字段名称设为“人数累计”,即从1开始逐个向下累加,每次累加1人
3、第三列数据字段名称设为“工资累计”,使用EXCEL公式表示:
本单元格数据=上单元格数据+同行的“工资排序”单元格数据
4、第四列数据字段名称设为“人数百分比”,用同行的“人数累计”单元格数据除以人员总数
5、第五列数据字段名称设为“工资百分比”,用同行的“工资累计”单元格数据除以工资总数
6、第六列数据字段名称设为“梯形面积”,按照前述的计算原理编辑公式即可
通过以上步骤,最后将“梯形面积”字段的数值累加,即为前文所述的B 面积,用直角三角形面积减去B面积即得A面积,则基尼系数可得。
四、小结
通过以上样本区间微分面积离散累积法所获取的基尼系数,应该说是与理论完全一致的;特别是在样本数量足够多的情况下,甚至可以用线段长度代替梯形面积进行计算(读者可自行证明)。
由于计算中没有涉及到任何四则运算之外的概念,且最大限度运用了EXCEL表间公式的功能,使问题的解决简单而高效,充分体现了“复杂问题简单化”的思想,值得借鉴。
另外,在上有一篇山西农业大学经贸学院张建华先生在2006年前发表的《推介一个简便易用的基尼系数计算公式》,理论分析更加透澈。
本文与该文章的思路方法完全一致,看来“英雄所见略同”,特向张建华先生表示敬意。
董凌云
2009年5月12日
附1:基尼系数计算的EXCEL模板
附2:基尼系数的经济含义
基尼系数指在全部居民收入中,用于进行不平均分配的那部分收入占总收入的百分比。
基尼系数最大为“1”,最小等于“0”。
前者表示居民之间的收入分配绝对不平均,即100%的收入被一个单位的人全部占有了;而后者则表示居民之间的收入分配绝对平均,即人与人之间收入完全平等,没有任何差异。
但这两种情况只是在理论上的绝对化形式,在实际生活中一般不会出现。
因此,基尼系数的实际数值只能介于0~1之间。
经济学家们通常用基尼指数来表现一个国家和地区的财富分配状况。
这个指数在零和一之间,数值越低,表明财富在社会成员之间的分配越均匀;反之亦然。
按照联合国有关组织规定,基尼系数:
——低于:表示收入绝对平均;
———:表示比较平均;
———:表示相对合理;
———:表示收入差距较大;
——以上:表示收入差距悬殊。
通常把作为收入分配差距的“警戒线”。
一般发达国家的基尼指数在到之间,美国偏高,为。
中国大陆和香港的基尼系数都超出。
据最新资料,2007年中国国的基尼系数已经达到以上。