当前位置:文档之家› 统计学试题及其参考答案

统计学试题及其参考答案

统计学试题及其参考答案
统计学习题参考答案(因为时间匆忙错误难免,敬请谅解。

感谢朱卫忠、李欣荣、朱
志红、过晓强等同学的辛勤付出)
名词解释
1【频率与概率】:在重复多次后,出现“正面”(或“反面”)这个结果的比例称之为频率。

概率是描述随机事件发生可
能性大小的一个度量。

设在相同条件下,独立地重复n次实验,
随机事件A出现f次,则称f/n为随机事件A出现的频率。

当n
逐渐增大时,频率f/n始终在一个常数左右作微小摆动,则称该
常数为随机事件A的概率,可记为P(A),简记P。

P4 2【正
态曲线】:是一条中央高,两侧逐渐下降、低平,两端无限延
伸,与横轴相靠而不相交,左右完全对称的钟形曲线,称为正态
曲线。

P20-百度 3【相关系数】:又称pearson积差相关系数,
以符号r表示样本相关系数,符号表示其总体相关系数。

它用来
说明具有直线关系的两变量间相关的密切程度与相关方向。

P156 4【变异系数】:记为CV,多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与
成人身高变异程度的比较。

实质上是一个相对变异指标,无单
位。

P20
5【假设检验中的P值】:从假设检验的整个逻辑推理过程可
看出,P的含义是指从H0规定的总体中随机抽样,抽得等于及大
于或(和)等于及小于现有样本获得的检验统计量(如t、u等)
值得概率。

P36
6【抽样误差】:由个体变异产生、随机抽样造成的样本统计
量与总体参数的差异,称为抽样误差。

P27
7【可信区间】:可信区间的确切含义为从固定样本含量的已
知总体中进行重复随机抽样试验,根据每个样本可算得一个可信
区间,则平均有1-α的可信区间包含了总体参数,而不是总体参
数落在该范围的可能性为1-α。

P33
8【决定系数】:定义为回归平方和与总平方和之比。

P158
9【检验效能】:1-β称为检验效能,过去称为把握度。

其意
义为当两总体确有差异,按规定检验水准α所能发现该差异的能
力。

P43
10【参考值范围】参考值范围也称为正常值范围,是指绝大
多数“正常人”的某指标值范围。

这里的“绝大多数”可以是
90%、95%、99%等,最常用的是95%。

所谓“正常人”不是指
健康人,而是指排除了影响所研究指标的疾病和有关因素的同质
人群。

P23-百度
选择题(红色答案为标准答案)
1. 成组设计的方差分析中,必然有: D A.SS
组内 r0.05(n-2)时,可认为两变量X与Y间: D
A.有一定关系
B.有正相关关系
C.一定有直线关系
D.有直线关
24. Y=14+4X是1-~7岁儿童以年龄(岁)估计体重(市斤)的回
归方程,若体重换成公斤,则此方程:
C A.截距改变 B.回归系数改变
C.两者都改变
D.两者都不改变
25.四格表的自由度为:
B A.不一定等于1
B.一定等于1
C.样本含量减1
D.等于行数×列数
26.同一双变量资料进行直线相关与回归分析,有:
B A. r>0, b0, b>0 C. r0
D .r=b
27. 计算相对数的目的是: A
A.为了表示实际水平
B.为了便于比较
C.为了表示绝对水平
D.为了说明数据大小
28.已知总体均数和标准差,要推断某一样本含量为100,样本
代表的总体是否与已知总体相同,该用什么方法?
B A .t检验 B. u检验
C.X2检验
D. t,u检验均可
29.经临床观察80例自发性气胸患者,病变结果是:肺部无病
变25例(31.25%)肺结核23例(28.75%),肺气肿20例(25%),哮喘6
例(7.5%),肺炎4例(5%),肺癌2例(2.5%),对此资料,可用( )来表达:
C A.直方图 B.直条图 C.构成图 D.线图
30.欲比较甲,乙两矿工人矽肺患病的严重程度,但甲,乙两矿工人的工龄分布不同,此时适当的比较方法是:
D A. 分工龄进行比较
B.用两个率比较的X2检验
C.不具可比性,不能比较
D.对工龄进行标化后再比较
简答题:
1. 描述集中趋势的指标有哪些?其适用范围有何异同?P14-16
答:常用的有算数均数、几何均数和中位数。

算数均数,可用于反映一组对称分布的变量值在数量上的平均水平。

几何均数,可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平,在医学上常适用于免疫学的指标。

中位数,适用于各种分布类型的资料,尤其是偏态分布资料和一端或两端无确切数值的资料。

百分位数,重要用途是确定医学参考值范围。

2标准化的意义是什么?P81
答:采用某影响因素的统一标准构成以消除构成不同对合计率的影响,使通过标准化后的标准化合计率具有可比性。

3常用相对数的指标有哪些?它们的意义和计算上有何不同?P77-79
答:常用的相对数指标有构成比、率、相对比等。

一、构成比表示事物内部各个组成部分所占的比重,通常以100为例基数,故又称为百分比(pr\\ercentage)。

其公式如下:公式(见书本)
该式可用符号表达如下:二、率表示在一定条件下,某现象实际发生的例数与可能发生这种现象的总数之比,用以说明某种现象发生的频率,故又称为频率指标,以100,1000,10000或100000为比例基数(K)均可,原则上以结果至少保留一位整数为宜,三、相对比表示有关事物指标之对比,常以百分数和倍数表示,
4二项分布、泊松分布和正态分布有何联系?
答:
正态分布:估计连续型随机变量正态分布资料的频数分布
二项分布:在每次试验中只有两种可能的结果,而且是互相对立的;每次实验是独立的,与其它各次试验结果无关
Poisson分布:是一种单参数的离散型分布,表示单位时间或空间内某时间平均发生的次数
当n较大或π不接近0或1时,二项分布可看成近似正态分布
Poisson可看做是二项分布的一种极限情况,即π很小而n趋于无穷大时,二项分布近似于Poisson分布,而当μ>=20时, Poisson分布可作为正态分布来处理。

5方差分析要具备哪些条件P56
答:多个样本均数比较的方差分析其应用条件为:A 各样本是相互独立的随机样本,均来自正态分布总体;B 相互比较的各样本的总体方差相等,即具有方差齐性。

6多重比较主要的方法和使用特点
答:
一:LSD-t检验:适用于一对或几对在专业上有特殊意义的样本均数间的比较。

二:Dunt-t检验:适用于g-1实验组与一个对照组均数差别的多重比较;三:SNK-q检验:亦称q检验,适用于多个样本均数两两之间的全面比较。

7析因设计和随机区组设计有何异同点
答:析因设计是一种多因素的交叉分组设计。

它不仅可检验每个因素各水平间的差异,而且可检验各因素间的交互作用。

随机区组设计则单因素多因素均可。

析因设计各处理组间在均衡性方面的要求与随机设计一致,各处理组样本含量应尽可同;析因设计对各因素不同水平的全部组合试验,故具有全面性和均衡性. 随机区组设计只有一个处理因素,无交叉效应可言;析因设计属
于多因素设计,既可分析因素的主效应,也可以分析因素之间的交互效应。

8实验设计主要有哪些类型P562
答:1平行组设计;2交叉设计;3析因设计。

9相关与回归的联系与区别?
答:联系表现为:
两者是相辅相成的,由相关分析法测定的变量之间相关的密切程度,对是否有必要进行回归分析以及进行回归分析意义的大小起着决定的作用,相关程度大,进行回归分析的意义也大,相关程度小,进行回归分析的意义就小,甚至没有必要进行回归分析。

同时,相关系数还是检验回归系数的标准,回归分析的结果也可以推算相关系数。

因此,相关分析与回归分析是相互补充密切联系的,相关分析需要回归分析来表明现象数量关系的具体形式,而回归分析则应建立在相关分析的基础上。

区别主要表现在:
1、相关关系是用来度量变量与变量之间关系的紧密程度的一种方法,在本质上只是对客观存在的关系的测度。

回归分析是根据所拟合的回归方程研究自变量与因变量一般关系值的方法,可由已给定的自变量数值来推算因变量的数值,它具有推理的性质。

2、在研究相关关系时,不需要确定哪个是自变量,哪个是因变量,但回归分析的首要问题就是确定哪个是自变量,哪个是因变量。

3、现象之间的相关关系的研究,只能计算一个相关系数;而回归分析时回归系数可能有两个,也就是两现象互为因果关系时,可以确定两个独立回归方程,从而就有两不同的回归系数。

10某资料的x与y的相关系数r=0.8,可否认为X与Y有较密切的相关关系?。

相关主题