江南大学现代远程教育2012年上半年第一阶段测试卷考试科目:《统计学》第0 章至第4 章(总分100分)时间:90分钟一、简答题1、简述统计一词有几种的含义。
统计有三种理解:统计工作,统计资料,统计学,三者关系:统计工作与统计资料是统计过程与活动成果的关系,统计工作与统计学是统计实践与统计理论的关系,统计工作先于统计学。
统计学研究的对象是统计研究所要认识的客体。
2、简述什么是描述统计和推断统计,并说明两者的关系。
描述统计学研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合概括与分析得出反映客观现象的规律性数量特征。
推断统计学则是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。
描述统计和推断统计是统计方法的两个组成部分。
描述统计是整个统计学的基础,推断统计则是现代统计学的主要内容。
由于在对现实问题的研究中,所获得的数据主要是样本数据,因此,推断统计在现代统计学中的地位和作用越来越重要,已成为统计学的核心内容。
当然,这并不等于说描述统计不重要,如果没有描述统计收集可靠的统计数据并提供有效的样本信息,即使再科学的统计推断方法也难以得出切合实际的结论。
从描述统计学发展到推断统计学,既反映了统计学发展的巨大成就,也是统计学发展成熟的重要标志。
3、什么是参数,什么是统计量?参数:描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。
统计量:统计量是统计理论中用来对数据进行分析、检验的变量。
4、什么是统计规律?统计规律:对大量偶然事件整体起作用的规律,表现这些事物整体的本质和必然的联系,而个别事件的特征和偶然联系退居次要地位。
统计规律是自然科学和人类社会生活中的普遍规律之一。
5、统计数据有哪几种计量类型。
在统计学中,统计数据主要可分为四种类型,分别是定类数据,定序数据,定距数据,定比变量。
1.定类数据(Nominal):名义级数据,数据的最低级,表示个体在属性上的特征或类别上的不同变量,仅仅是一种标志,没有序次关系。
2.定序数据(Ordinal):数据的中间级,用数字表示个体在某个有序状态中所处的位置,不能做四则运算。
3.定距数据(Interval):具有间距特征的变量,有单位,没有绝对零点,可以做加减运算,不能做乘除运算。
例如,温度。
4.定比变量(Ratio):数据的最高级,既有测量单位,也有绝对零点,例如职工人数,身高。
一般来说,数据的等级越高,应用范围越广泛,等级越低,应用范围越受限。
不同测度级别的数据,应用范围不同。
等级高的数据,可以兼有等级低的数据的功能,而等级低的数据,不能兼有等级高的数据的功能。
6、简述统计调查方案的内容。
统计调查方案是统计调查前所制订的实施计划,是全部调查过程的指导性文件。
是调查工作有计划、有组织、有系统进行的保证。
统计调查方案应确定的内容有:调查目的与任务、调查对象与调查单位、调查项目与调查表、调查时间和调查时限、调查的组织实施计划。
7、什么叫离散系数,它有什么特征和作用。
离散系数,离散系数又称变异系数,是统计学当中的常用统计指标,主要用于比较不同水平的变量数列的离散程度及平均数的代表性。
变异系数是衡量资料中各观测值变异程度的一个统计量。
当进行两个或多个资料变异程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。
如果单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。
8、简述统计描述数据分布特征的统计图有哪些?(1)条图:又称直条图,表示独立指标在不同阶段的情况,有两维或多维,图例位于右上方。
(2)百分条图和圆图:描述百分比(构成比)的大小,用颜色或各种图形将不同比例表达出来。
(3)线图:用线条的升降表示事物的发展变化趋势,主要用于计量资料,描述两个变量间关系。
(4)半对数线图:纵轴用对数尺度,描述一组连续性资料的变化速度及趋势。
(5)直方图:描述计量资料的频数分布。
(6)散点图:描述两种现象的相关关系。
(7)统计地图:描述某种现象的地域分布。
二、计算与操作题1、下面是某班50名同学数学和外语的考试成绩,要求计算:(1)50名数学成绩平均数、中位数和标准差;(2)50名外语成绩平均数、中位数和标准差;(3)分别计算数学和外语的标准差系数,并说明那门课程程及分布的离散程度大。
数学成绩人数外语成绩人数30-40 40-50 50-60 60-70 70-80 80-90 90-100 35814106430-4040-5050-6060-7070-8080-9090-100136152221合计50 50解答:1) 平均数:x= (35*3+45*5+55*8+65*14+75*10+85*6+95*4)/(3+5+8+14+10+6+4)=66.4中位数:3+5+8+14+10+6+4=50 为偶数中间两位是65,65 所以中位数是(65+65)/2=65标准差:σ=√{[3*(35-66.4)^2+5*(45-66.4)^2+8*(55-66.4)^2+14*(65-66.4)^2+10*(75-66.4)^2+6*(85-66.4)^2+4*(95-66.4)^2]/(50-1)}=162)和1)类似只要把数据换一下1 3 6 15 22 2 13)数学标准差系数 Vσ= σ/ x =16/66.4=0.24 根据2)求出外语的标准差系数比较哪个离0远,哪个的离散度就大2、对某地区90家纺织企业年销售额的调查资料如下年销售额企业数500以下10500-1000 201000-1500 351500-2000 152000以上10要求;1.计算90家企业销售额的众数、中位数、平均数。
2.计算标准差和标准差系数。
解答:已知N=90家企业的销售额如下年销售额组中值频数500以下250 10500-1000 750 201000-1500 1250 351500-2000 1750 152000以上2250 1090江南大学现代远程教育2012年上半年第二阶段测试卷考试科目:《统计学》第6 章至第8 章(总分100分)时间:90分钟一、简答题(40分)1、描述统计数据集中趋势的指标有哪些?答:平均数、众数、中位数2、描述统计数据离散程度的指标有哪些?答:极差、平均差、方差和标准差、离散系数3、什么是样本平均数的分布规律?答:当总体服从正态分布或样本足够大时,样本平均数以总体均值为均值,总体方差的1/n为方差的正态分布。
4、影响样本容量的因素有哪些?答:总体方差、抽样估计的置信水平和估计误差5、重复抽样与不重复抽样有什么不同?答:取得样本单位的抽样方式不同;抽样的平均误差不同。
6、抽样调查中的随机原则是指什么?抽样推断时为什么必须遵循随机原则抽取样本?答:随即原则即就是等可能性原则,每一个总体单位有相同的概率进入样本。
为了保证样本的分布特征尽可能接近总体分布特征。
7、简述概率抽样的主要形式有哪些?答:简单随即抽样、分层抽样、机械抽样、整群抽样等。
8、什么是置信水平?答:所谓置信水平是指抽样估计的可信水平。
通常在参数估计时事先给定。
二、计算题1、(10分)从某企业随机抽取100职工的工资收入分布如下:收入(元)人数(人)600-800 800-1000 1000-1200 1200-1400 1400-1600 1600以上 4 10 24 32 22 8 合计100试计算:(1) 该企业职工工资的样本平均数和样本标准差;(2)以95.45%置信水平估计该企业职工平均工资收入的置信区间;(3)以95.45%置信水平估计该企业职工平均工资收入小于1000元的比例。
解:2、(10分)某个灯泡厂每月生产5000000个灯泡,在进行质量抽查中随机抽取500个进行检验,这500个灯泡的耐用时间见下表:耐用时间(小时) 灯泡数 800~850 850~900 900~950 950~1000 1000~1050 1050~110035 127 185 103 42 8试计算:a. 该厂全部灯泡耐用时间99.73%的置信区间;b. 检查500个灯泡的不合格率为0.4%,在95.45%概率保证下,估计全部不合格品率的置信区间。
c.3. (10分)某厂家在广告中声称,该厂生产的汽车轮胎在正常行驶条件下的平均寿命高于25000km 。
对一个由15个轮胎组成的随机样本作了试验,得到样本均值和标准差分别28000km 和5000km 。
假定轮胎寿命服从正态分布,问该厂家的广告是否真实。
(t 0.05(14)=1.761, t 0.025(14)=2.1448)解:4、(10分)甲、乙两个企业生产三种产品的单位成本和总成本资料如下:产品名称单位成本(元)总成本(元)甲企业 乙企业 A B C15 20 302100 3000 15003255 1500 1500试比较哪个企业的总平均成本高并分析其原因。
5、(10分)调查了350名50岁以上的人,其中200名吸烟者中有40人患慢性支气管炎,在150名不吸烟者中有15人患慢性支气管炎。
调查数据是否支持“吸烟者容易患慢性支气管炎”这种观点。
(а=0.05)(10分)(Z 0.025=1.96, Z 0.05=1.6445))解:6、(10分)一个市场调查公司为了了解某城市有多少比例的家庭购买A 品牌热水器,事先需要确定样本容量。
该公司希望以90%的置信度估计这一比例,且估计误差不超过5%。
一个事先由15个家庭组成的预备样本中有30%家庭购买该品牌。
试问需要抽取多大样本。
解:225.937、(10分)某车床生产的零件直径为5cm ,现在为了了解车床是否正常,随机抽取10件零件进行检验,测定平均直径为5.3cm ,标准差为0.3cm 。
(1)是分别以5%和1%的显著性水平检验车床性能是否良好; (2)两者结果是否矛盾,并对检验结果作出合理解释。
已知:(t0.025(9)=2.262,t0.005(9)=3.2498)、(10分)为了了解湿度对棉线的抗拉强度有无影响,测定了三个不同的湿度水平,得到数据如下表: 湿度水平1 湿度水平2 湿度水平330 31 33 30 42 45 46 47 53 52 48 47 合计124180200要求:以显著性水平a=0.1检验湿度对抗拉强度有无影响。
(F 0.05(2,9)=10.13)。