统计学习题试卷
。
A. 68%
B. %
C. %
D. 95%
8. 在离散程度的测量中,最容易受极端值影响的是
。
A.
四
分
位
差
B.
极
差
C. 标 准 差
D.
平均差
9. 根 据 两 个 独 立 的 、 来 自 正 态 分 布 的 小 样 本 估 计 两 个 总 体 方 差 之 比 时 , 使 用 的 分 布
是
。
A. 正态分布
当时间序列有较大的随机波动时,宜选择较大些的平滑系数 ;当时间序列比较平稳时,宜选较小的 。
确定 时,选择几个 分别进行预测,使得均方误差最小的 就是最优的 。
四、 计算题
1、① 由于抽取一人,该生成绩服从正态分布 N(70,12),
P(X>82)=1根据经验法则,在平均分加减一个标准差范围之内的数据占
立。
3、指数平滑法是适合于平稳序列的一种预测方法。指数平滑法是对过去的观测值加权平均进行预测
的一种方法,观察值时间越远,其权数也跟着呈现指数下降。该方法使得第 t+1 期的预测值等于第
t 期的实际观测值与第 t 期预测值的加权平均值,其模型为:
通常 = ,则 = 。
Ftt11 Ytt (11 ))FFtt
②非概率抽样不是依据随机原则抽选样本;样本统计量的理论分布是不确切的,无法用样本结果
对总体的参数进行估计。操作简便、时效快、成本低,对统计学专业技术要求不是很高。
2、相同点:都是利用样本对总体进行某种推断。
不同点:推断的角度不同:参数估计是用样本统计量估计总体参数的方法,总体参数在估计前是未
知的;假设检验则是先对总体参数的值提出一个假设,然后利用样本信息去检验这个假设是否成
习题十二
一、单项选择题
1. 下列不属于描述统计问题的是
。
A. 根据样本信息对总体进行的推断
B. 了解数据分布的特征
C. 分析感兴趣的总体特征
D. 利用图、表或其他数据汇总工具分析数据
2. 下面的哪种抽样调查的结果不能用于对总体有关参数进行估计
。
A. 配额抽样
B. 系统抽样
C. 分层样本
D. 整群抽样
。
A. 8
B. 50
C. 64
D. 2500
6. 用组中值代表各组的实际数据的假定条件是
。
A. 各组的频数均相等
B. 各组的组距均相等
C. 各组的变量值均相等
D. 各组数据在本组内呈均匀分布
7. 某班学生的平均成绩是 75 分,标准差为 5 分,如果已知该班学生的考试分数为非对称分布,
可以判断成绩在 60~85 分之间约占
df
MS
F
P-value
crit
组间
3
组内
—
—
—
总计
—
—
—
—
① 将方差分析表中所缺数据补齐,并写出计算过程。(计算结果保留 2 位小数)
② 显著性水平 =,检验四个总体均值之间是否有显著差异(写出具体检验步骤)。 ③ 若此检验结果可信,上述分析必须满足什么条件。 4. 根据 2013 年 1 季度到 2016 年 4 季度我国居民人均消费支出的季度数据(单位:元),做线 图如下:
3. 与概率抽样相比,非概率抽样的缺点是
。
A. 样本统计量的抽样分布是确定的
B. 调查的成本比较低
C. 不适合探索性的研究
D. 无法使用样本的结果对总体相应的参数进行推断
4. 对于小批量的数据,最适合描述其分布的图形是
。
A. 条形图
B. 直方图
C. 茎叶图
D. 饼图
5. 一组数据的离散系数为,平均数为 20,则方差是
要求低于 1%,置信水平为 95%,应抽取多少学生进行调查 3. 一位金融分析师随机抽取了 366 个家庭,询问他们户主的年龄和投资在股票市场的资产比
例,年龄分为 4 个类别,该分析员想要判断是否资产比例会因股票所有人的年龄不同而不同。 根据数据做了单因素方差分析如下( =):
方差分析表
差异源
F
SS
(
)
(
)
()
()
()
(
)
(
)
()
(
)
(
)
三、简答题 1. 比较概率抽样和非概率抽样的特点。 2. 假设检验和参数估计有什么相同点和不同点 3. 解释指数平滑法。
四、计算题 1. 假设某年级期末统计学考试成绩服从正态分布,平均成绩为 70 分,标准差为 12 分: ① 随机抽取 1 人,粗略计算该同学成绩在 82 分以上的概率; ② 随机抽取 144 人,不及格的学生有 18 人,依此计算全年级统计学不及格率的 95%的置信区 间。 ③ 随机抽取 144 人,不及格的学生有 18 人,以 的显著性水平判断全年级不及格率是否明 显高于 10% 2. 某高校随机抽取的 225 名学生的体重资料如下: ① 试根据所给资料计算学生体重的算术平均数,将计算过程直接填入表中。
B. t 分布
C. F 分布
D. 2 分布
10. 当置信水平一定时,置信区间的宽度
。
A. 随着样本量的增大而减小
B. 随着总体波动性的增大而减小
C. 与总体波动性的大小无关
D. 与样本量的平方根成正比
11. 对于同一个列联表计算的 V 系数和 系数,其结果是
。
A. V 值必然小于 值
B. V 值必然等于 值
1. × 2. √ 3. √ 4. √ 5. √ 6. × 7. √ 8. × 9. × 10. ×
三、 简答
1、①概率抽样依据随机原则抽选样本;样本统计量的理论分布是存在的,可根据调查结果对总体的
参数进行估计;在抽样设计时,对估计的精度提出要求,可计算出所需样本量。要求有较高的统
计学专业知识,费用较高。
按体重分组(公斤) 学生人数(人)
52 以下
27
52—55
42
55—58
72
58—61
56
61 以上
28
合计
225
② 根据其他资料计算当地人均体重为 58 公斤,以 的显著性水平,判断该校学生的平均体
重与当地人均体重之间的关系。已知由数据求出的样本标准差 s=公斤。(写出具体检验步骤) ③ 调查的学生中有 9 人体重严重偏低,学校想了解全校体重偏低的学生所占比例,估计误差
二、判断题
1. 根据普查数据计算的描述特征的概括性度量值称为统计量。 2. 雷达图主要用于研究不同样本之间的相似性。 3. 对于分类数据,用 countif 函数和插入透视表均可得到频数分布表。 4. 对于顺序数据,可以用异众比率和四分位差来测度其离散程度。 5. 用 average 求平均数时,可以选中多行多列求均值。 6. 柱形图、箱线图都可以展示数据的分布形态。 7. 假设检验时,拒绝原假设,则意味着备择假设是对的。 8. 假设检验的备择假设是那些原有的、传统的、希望用事实推翻的观点。 9. 单因素方差分析时,组间平方和只含有随机误差。 10. 一组数值与平均数的离差绝对值之和最小。
, 所以 P(X>82)==
68% , 即
②p=
,总体比例的 95%的置信区间是:
即(%,%) ③设全年级统计学不及格率为
右单侧检验
,不能拒绝 没有足够的证据证明全年级的不及格率高于 10%。 2. ①计算过程见下表:
按体重分组(公斤) 学生人数(人)
组中值
52 以下
27
52—55
42
55—58
72
① 说明此序列含有什么成分并写出理由。 ② 写出用多元回归法对此数据的预测过程。 ③ 写出用分解法对此数据预测的步骤。
一、 单项选择:
1. A 2. A 3. D 4. C 5. C 6. D 7. B 8. B 9. C 10. A 11. D 12. A 13.
B 14. B 15. D
二、 判断题
根据
=9604
应选取 9604 名学生,才能使得 95%的置信区间的估计误差在 1%以内。 或者:
法二:取
=≈1476
应选取 1476 名学生,才能使得 95%的置信区间的估计误差在 1%以内。 3、①方差分析表
差异源
SS
df
MS
F
P-value
组间
3
F crit
组内
362
—
—
—
总计
365
—
—
—
—
C. V 值必然大于 值
D. V 值可能小于 值
12. 一所大学准备采取一项学生在宿舍上网收费的措施,为了解各年级学生对这一措施的看法,
从大一到大四每个年级随机抽取了 50 名学生进行调查,学生的看法有三种态度:赞成、中立、
反对。根据调查整理成列联表,则计算出的 分布的自由度为
。
A. 6
B. 5
C. 3
现在每年的 2、3、4 季度人均消费支出都是明显上升,而第 1 季度到第 2 季度是明显下降;趋势体现
在,如果将每年相同季度的数据用直线连起来,都表现出上升趋势。所以含有季节、趋势和随机成分。
②季节多元回归法预测过程:
设虚拟变量 则季节多元回归方程可表示为:
式中, 是时间序列的平均值; 是趋势成分的系数,表示趋势给时间序列带来的影响;第 4 季度是 参照季度,即基础水平,这些虚拟变量前系数的含义是:每个季度与第 4 季度的差值(为正数表示高 出第 4 季度多少,为负数表示低于第 4 季度多少)。 根据数据,给出 t 和三个虚拟变量的值,做回归得到各系数的估计值,然后依据方程的显著性检验(F 检验)和系数的显著性检验(t 检验)得到一个各检验都显著的结果,同时调整的 R2 最大且估计误差 最小的结果,然后用此结果计算出 Y 的预测值即可。 ③预测步骤: