当前位置:
文档之家› 第2章-统计数据的收集与整理
第2章-统计数据的收集与整理
如:第五次人口普查登记的标准时间是2000 年11月1日零时
(3)准确性一般较高,较规范; (4)适用的对象较窄,只能调查一些最基本、 最一般的现象。
2、抽样调查
从调查对象的总体中随机抽取一部分单位作为样 本进行调查,并根据样本调查结果推断总体数量特征。
●特点: (1)经济性强:工作量小、可节省人、财、物力
1、抽样调查是随机抽取调查单位,不存在对调 查对象选择的主观性,因此可以根据抽样结果推断总 体的数量特征;
2、重点调查和典型调查不是随机取样,具有一 定的主观性,因此调查结果不能推断总体。
(二)数据的搜集方法
1、访问调查(派员调查):调查者与被调查者通 过面对面的交谈获取调查资料;
2、邮寄调查:通过邮寄或其他方式将问卷送至被 调查者,由被调查者填写问卷并寄回或投放到指定收 集点;
●绝对统计数据的计量单位: 实物单位(吨、公里) 价值单位(元、万元)、 复合单位(吨公里、元/人)
(2)相对数
相对数是两个绝对数的比值,反映事物的相对 数量
● 相对数的表现形式: 比例、比率 比例(Proportion) :一个总体中各个部分的数 量占总体数量的比重,通常反映总体的构成或结构。 例5:一数量为N的总体被分为K个部分,各部分 的数量分别为 Ni,则比例定义为:Ni/N。显然有:
(2)时效性高:可迅速、及时地获得所需要的信 息
(3)适应面广:可获得更广泛的信息,适用于各 个领域、各种问题的调查;
(4)准确性高:用工量小,从而工作可做得更细, 误差往往很小。
3、统计报表
按国家有关法规规定,自上而下地统一布置,自下而上地 逐级提供基本统计数据。
●特点:
统一的表式、统一的指标、统一的报送时间、统一的报送 程序。
Quantitative, discrete.
三、统计数据的表现形式
1、数量型统计数据两种基本表现形式:
绝对数、相对数
(1)绝对数: 绝对数是统计数据的基本表现形式,表明事
物(现象)的总体规模或一般水平。 如:一地区的总人口、GDP、商品零售额等
●绝对数按其反映事物现象的时间状况不同可分 为:
时期数和时点数。
N 1N N 2N N kN 1
比率(Ration) :各不同类别的数量比值。
可以是同一总体中不同部分的数量对比 如:总人口中:男性/女性;
GDP中:固定资产投资/居民消费 GDP中:三次产业增加值之比 可以是同一现象在不同时间或空间上的数量之比 如:不同年份GDP之比 经济增长率
a)
What is your age?
Quantitative, theoretically continuous, but discrete in practice.
b)
What is your sex?
Qualitative.
c)
What is your marital status?
Qualitative.
本户
省,市
县
乡
镇
住址
自治区
市
街道
居委会
姓名
与户 主关 系
性别 出生 民族 年月
常住人口 户口登记 状况
文化 行业 程度
1
2
345
6
78
村 街巷 号 职业 就业 婚姻
状况 状况
9 10 11
生育 子女 总数
12
申报人:
普查员:
填报日期: 月 日
户主签名:
佛罗里达州Lobster Pot 饭店所用的顾客意见调查表:
如:年龄、产品产量、零件尺寸
数量变量
离散变量(discrete variable) 连续变量(continuous variable)
Ex 1:
Information concerning a magazine’s readership is of interest both to the publisher and to the magazine’s advertisers. A survey of 20 subscribers included the following questions. For each, determine the data type of possible responses.
• 时期数反映事物现象在一定时期内的总量;
• 如:产量、产值、出生人口
• 时点数反映事物现象在某一瞬间时刻上的总量;
如:人口数、股票价格等
●特点:
1、时期数可连续计数,并可累计,时点数只能 间断计量,不能累计;
2、时期数形成时间序列数据(Time series data); 3、时点数形成截面数据(Cross-sectional data)。
对不同类型的数据,采用的统计方法可能有所不同:
品质数据:组频率; 数量数据:更多
注意: • 变量:表征个体特征的量; • 变量值:变量的具体表现
统计数据
品质变量(qualitative variable):变量由品质数据来记录
如:性别(男、女);产品等级(一等、二等、三等)
数量变量(数字变量)(quantitative variable):变量由数量 数据来记录
d)
Is your annual income less than $20 000, between $20 000 and
40 000, or over $40 000?
Qualitative, ranked.
e)
How many other magazines do you subscribe to?
• 按照对事物计量的精确程度,可将所采用的计 量尺度由低级到高级分为四个层次: 定类尺度(Nominal Level)列名水准 定序尺度(Ordinal Level)顺序水准 定距尺度(Interval Level)间隔水准 定比尺度(Ratio Level)比率水准
(一)定类尺度
定类尺度(列名尺度):按照事物的某种属性对其进行平 行的分类或分组。
XX 产品 能力 产量
1
2
1
2
1
2
单位负责人:
填表人:
报出日期:
4、重点调查
从调查对象的全部单位中选择少数重点单位进行 调查(适用于“同类”中的“大户”)。
5、典型调查 从调查对象的全部单位中选择一个或几个有代表 性的单位进行调查。(不一定针对“大户”)
▼注意:
重点调查、典型调查与抽样调查的不同处在于:
●类型:
(1)按报送调查范围分: 全面报表:调查对象中的每一个单位都填报 非全面报表:只要求调查对象中的一部分单位填报
(2)按报送时间间隔分 日报、月报、季报、年报
(3)按报送地域(机构)范围分: 国家报表、地方报表、部门报表
主要工业产品生产能力 200 年
省辖市 XX 产品 名称 能力 产量
XX 产品 能力 产量
如:人口普查、工业普查等 ●特点: (1)通常是周期性的或一次性的,涉及面广、耗 时、费力,一般需间隔较长时间; 如:1953、1964、1982、1990、2000(人口普查)
逢“0”年份:人口普查 逢“3”年份:第三产业普查 逢“5”年份:工业普查
(2)一般需要规定统一的标准调查时间,以 避免调查数据的重复或遗漏;
(二)定序尺度
定序尺度(顺序尺度):是对事物之间等级或顺 序差别的一种测度。
例2:产品等级(一等品、二等品…) 考试成绩(优、良、中、可、差)
●特点: 1、不仅可以测度类别差(分类),还可以测度 次序差(比较优劣或排序); 2、无法测出类别之间的准确差值,因此该尺度 的计量结果只能排序,不能进行算术运算。
不同地区GDP之比 两个地区经济水平差异
•百分数(Percentage):将对比的基数抽象化为 100而计算的相对数。
第二节 统计数据的搜集
统 计 数 据 的 来 源
从 数 据 本 身 的 来 源 看 直 接 调 查 或 试 验 从 使 用 者 的 角 度 看 直 接 调 查 和 科 学 试 验 ( 直 接 的 统 计 数 据 )
二、数据的类型
统计数据是采用某种计量尺度对事物进行计量的结果。 采用不同的计量尺度 不同类型的统计数据:
定性数据 定量数据
定性数据(品质数据)(Qualitative data):说明的 是事物的品质特征,不能用数值表示。(由定类尺度或 定序尺度计量形成)
定量数据(数量数据)(Quantitative data):说明的 是事物的数量特征,能够用数值表示。(定距尺度或定 比尺度计量形成)
第二章 统计数据的收集与整理
一、数据的类型与计量 二、统计数据的搜集
三、统计数据的整理
第一节 数据的计量与类型
一、数据的计量尺度(Levels of Measurement) 统计数据是对客观现象计量的结果。
Data are the facts and figures that are collected, analyzed, and summarized for presentation and interpretation.
We are happy you stopped by the Lobster Pot Restaurant and want to make sure you will come back. So, if you have a little time, we will really appreciate it if you will fill out this card. Your comments and suggestions are extremely important to us. Thank you!
3、计量结果可以进行加减运算(加减运算有意义); 4、“0”是测量尺度上的一个测量点,并不代表“没 有”