中国家庭金融调查简介
数据库建设的意义
数据库建设的初衷是为学术界提供一个基础数据库
后来的发展让我们认识到数据库建设的意义不仅仅如此 中国缺乏对国情的了解 已有的数据缺乏验证 数据库对老百姓也有用
31
中国社会缺乏对国情的基本了解
2012年5月20日(5月13日数据发布一周后)关键词搜索量
内容概况
金融资产 支票 活期存款 股票 债券 基金 金融衍生品 金融理财产品 非人民币资产 黄金 现金 借出款
季度电话回访
获得受访户的电话号码作为季度电话回访(CATI)之用 CATI问卷包括: 对银行存款利率、物价指数、房屋市值、股票指数等方 面的预期 就业状况 金融市场的参与和盈亏状况 资产:房屋市值、借贷、车辆、债务 收入与消费 农村金融发展方面的指标
18
16
14
12
10
8
6
各年龄组人口占比(%)
6
8
10
12
14
16
18
人口普查2010
CHFS2011
其他信息比较
官方数据 企业与个体工商户 总数 企业数 政府机关雇佣人数 公务员 党员数 5010万 1253万 1181万(2009年) 689.4万(2010年) 8260万 CHFS (2011年) 官方数据/ CHFS 5841万 786万 1236万 709万 8200万 0.858 1.59 0.96 0.97 1.01
/
20
严格控制样本更换
下列情况才允许更换样本 在不同日期不同时间段拒访3次后(至少一次晚上 拒访) 6次无人应答(其中至少一次有社区联络人陪同) 经核实后地址错误的 经核实后为空户的 受访者身体原因无法访问的
是否有代表性?与统计局数据比较
人口统计学信息比较
指标 城市人口比例
家庭规模 平均年龄 男性比例 城市 农村
国家统计局 0.513 0.342 2.89 3.98 36.87 0.514
CHFS 0.497(按常住地) 0.360(按户口) 3.04 3.78 38.96 0.505
/
21
录音核查
对每个访员的第一份回传录音都进行录音核查, 以便发现访问中的问题。 访问前期对回传录音,随机抽取5%-10%进行录音 核查。 访问后期,对传回的每份录音均进行核查。
/
抽样与实施
当地社区/人行/CFPS/CGSS/SRC/NORC/Fed 大力帮助 对每位访员42小时的培训 制度安排: 已抽中的样本家庭只有在不同时间段拒访6次后,才允 许被放弃 团队采访保证安全、减少道德风险 非常严格的保密设计 访员的责任心与创造力 中国老百姓比我们起初想象的更为配合
2012年12月9日中国家庭金融调查与研究中心发布中国收入分配 情况 2012年1月18日国家统计局发布近十年基尼系数
数据与老百姓息息相关
全国住房空置率:15.5% 向市场提供及时精准信息:形成正常的房价预期
中国家庭金融调查简介
甘犁 中国家庭金融调查与研究中心 2013年10月
1
内容介绍
中国家庭金融调查 2011
中国家庭金融调查 2013 建立中国基础数据库 部分研究成果简介
2
2011年中国家庭金融调查
抽样与实施
将全国2,585县/区按人均GDP分成10组,每组随机抽取8个县/区。 每个县/区随机抽取4个社区(居委会、村委会)。每个社区农 村800户城市2000户。到社区以后就没有任何信息。 派出41支队伍,共232人次,前往全国320个社区,对每个社区 绘制住户地理分布图,建立末端抽样框。 派出32支队伍,共343位访员,到这些社区抽到的住户做面对面 的采访工作。 成功获得8,438户及29,450个人信息。
7月27日 7月28日 7月29日 7月30日 8月1日 8月2日
/
每日访问量统计
900 737 816 778 725 697 718 660 610 600 600 605 565 544 571 563 492 444 400 398 511 439 592 504 481 800 749
00503 00600 ……
/
23
数据核查
对下列情况进行识别,并核实是否为访问异常 访问时间少于30分钟 有效题量小于200 不知道比例大于5% 有效记录过少
/
关键词 中国家庭金融调查报告
自有住房拥有率/自有住房拥有率9成 第一套房000 1,690,000 34,700,000
谷歌
4,420,000 4,860,000 2,360,000 23,700,000
77%家庭炒股不赚钱
小学学历股市参与率
749
700 722 600 602 500 613 609 536 708 697 675 706
726
646
598 607 571 576
300
295 259 195 198 99 80 146 212
303 234 217 181 125 115 91 44
200
100
162
84
60
0
28 17
人口年龄结构比较
1.6 4.3 7.5 12 17.3 16.2 17.1 13.1 11
8070-79 60-69 50-59 40-49 30-39 20-29 10-19 0-9
2.3 5.4 10.3 14 17.2 15.2 15.9 10.4 9.3
7
当日完成量
2013年调查拒访率统计
总样本:10.86% 城市:15.39% 农村:0.87% 2013年新样本:12.59% 城市:17.44% 农村:0.94% 2011年成功接触的老样本:5.44% 城市:8.19% 农村:0.71% 2013年追访率(接触):82.13% 2013年追访成功率:77.66%
22
2013年8月2日录音核查表
组别 第一组 第二组 第三组 第四组 第五组 第六组 第七组 …… 合计 抽中访 问卷 错题 员数 总数 总数 2 3 5 5 6 7 5 …… 61 2 7 错误类型 需联络 的访员 没有取中值(43%)记录错误(43%)其他 (14%) 无终值追问(50%)记录错误(33%)其他 3 6 (17%) 没有取中值(33%)记录错误(29%)单位错 10 21 误(19%)其他(19%) 没有取中值(40%)记录错误(20%)单位错 11 15 误(20%)其他(20%) 记录错误(50%)没有取中值(25%)其他 12 20 (25%) 单位错误(39%)没有取中值(28%)其他 10 18 (43%) 5 1 记录错误(100%) …… …… …… 89 164
中国家庭金融调查:2014 - 季度及月度的CATI访问
通过科学的样本轮换,进行季度及月度的电话回 访(CATI)
每两年进行跟踪及部分样本替换
29
建设基础数据的重要性
/
季度电话回访
2012年4月、7月成功实施了两轮季度电话回访(CATI)。 CATI系统优势:
对中国家庭经济状况的及时反映。
迅速建立起追踪数据库。
/
总体:15.2%
中国健康与营养跟 踪调查 (CHARLS) 2008 预调查 城市:20.7%
农村:10.1%
普通样本:30% 2010 富裕样本:67%
美国消费者金融调 查 (SCF)
基础数据库
人口特征与就业 资产与负债 非金融资产 生产经营项目 土地与房产 汽车 其他非金融资产 金融资产 社会与商业保险 支出与非劳动收入
多次问卷测试
小组访谈:邀请不同年龄、学历、专业背景、行业的人 作为受访者,与经过专业培训的访员进行面对面的访问 和沟通。访问结束后,以座谈会的形式收集大家对问卷 的意见和建议。 预调查:在前期绘过图的社区随机抽部分受访者,进行 实地访问,访问结束后收集受访者对问卷的意见和建议。 访员和绘图员培训期间,鼓励学生发现问卷的问题并进 一步完善问卷。
15
2013年中国家庭金融调查
2013年调查规模
第一批调查情况 样本分布:29个省,160个区县 39个绘图队伍:244人 55个访问队伍:482人 第二批调查情况 样本分布:29个省,106个区县 67个访员队伍:708人
严格的质量控制
/
2013年调查访问工作
9月6日已经完成全部访问工作。
样本总量:28228户 全国除新疆、西藏、港澳台之外,每个省 都具有代表性。 成都、武汉具有代表性
/
24
7月27日-8月2日的数据核查统计表
访问时 间过短 6.09% 6.80% 6.68% 2.58% 5.80% 8.63% 总有效题 被访者回答不知 有效记 量过少 道的概率过高 录过少 1.48% 0.55% 2.03% 1.70% 2.18% 5.34% 0.72% 0.48% 6.44% 0.47% 0.70% 5.40% 0.28% 1.10% 4.42% 0.64% 1.28% 1.28%
/
我们的足迹
• 320个社区,80个县市,25个省份 • 访问了8438 个家庭 • 343位访员,232位绘图员
东北
中西部
东部
南部
低拒访率
调查项目 时间 拒访率 总体:11.6% CHFS 2011 城市:16.5% 农村:3.2%
样本量是否足够大?
统计分析的结果是否能反映总体的真实情况取决于样本是否随机、模型是 否正确、计算有没有错误以及对模型的分析是否用了恰当的方法。 通常,限于经费和时间的限制,样本是从总体中抽取的很小部分,样本的 随机性才是关键。100万的样本相对于13亿人,也仅仅是千分之一。 样本量的大小,既不是“能很好反映总体情况”的必要条件,也不是充分条 件。 样本量大小的真正作用是决定统计分析结果的误差。至于样本量需要多大, 这与需要反映的总体标准差有关。 如果用8438户来推断总体均值,抽样误差约是总体标准差的1%。