医学统计学试题一.选择题(每题2分,共20分)
1、有两个独立随机的样本,样本含量分别为n
1和n
2
,在进行成组设计
资料的t检验时,自由度是()
A、n
1+n
2
B、n
1+n
2
-1
C、n
1+n
2
+1
D、n
1+n
2
-2
2、标准误反映()
A、抽样误差的大小
B、总体参数的波动大小
C、重复实验准确度的高低
D、数据的离散程度
3、最小二乘法是指各实测点到回归直线的()
A、垂直距离的平方和最小
B、垂直距离最小
C、纵向距离的平方和最小
D、纵向距离最小
4、用样本推论总体,具有代表性的样本指的是()
A、总体中最容易获得的部分个体
B、在总体中随意抽取任意个体
C、依照随机原则抽取总体中的部分个体
D、用配对方法抽取的部分个体
5、随机误差指的是()
A、测量不准引起的误差
B、由操作失误引起的误差
C、选择样本不当引起的误差
D、由偶然因素引起的误差
6、某项指标95%医学参考值范围表示的是()
A、检测指标在此范围,判断“异常”正确的概率大于或等于95%
B、检测指标在此范围,判断“正常”正确的概率大于或等于95%
C、在“异常”总体中有95%的人在此范围之外
D、在“正常”总体中有95%的人在此范围
7、从甲、乙两文中,查到同类研究的两个率比较的χ2检验,甲文χ2>χ20.01,1,乙文χ2>χ20.05,1,可认为()
A、两文结果完全相同
B、甲文结果更为可信
C、乙文结果更为可信
D、甲文说明总体的差异较大
8、两样本均数比较的t检验和u检验的主要差别是()
A、 t检验只能用于小样本资料
B、 u检验要求大样本资料
C、 t检验要求数据方差相同
D、 u检验能用于两大样本均数比较
9、对医学计量资料成组比较,相对参数检验来说,非参数秩和检验的优点是()
A、适用范围广
B、检验效能高
C、检验结果更准确
D、不易出现假阴性错误
10、两数值变量相关关系越强,表示()
A、相关关系越大
B、相关系数越大
C、回归系数越大
D、相关系数检验统计量t值越大
[参考答案]
1-5:DACCD 6-10:DBBAB
二.名词解释(每题4分,共20分)
1、偏回归系数
2、Ⅱ型错误:
3、非参数检验:
4、残差平方和/剩余平方和:
5、率的标准误:
[参考答案]
增加或减少一个单位引起的Y的变
1.表示其他自变量保持不变时,X
j
化量。
2.指接受了实际上不成立的H0,即“存伪”的错误。
Ⅱ型错误的概率
用β表示。
3.不依赖于总体分布类型、不针对总体参数的检验方法,如假设两总体
分布相同检验统计量基于变量的秩等,这类检验方法称为非参数检验。
4.指除x对y的线性影响外,其它所有因素对y变异的影响,即在总
平方和中无法用x与y的线性关系所能解释的部分变异,用以表示考虑回归关系后,y的随机误差。
5.指用以衡量由于抽样引起的样本率与总体率之间的误差的统计量。
三.简答题(每题10分,共30分)
1、什么是两个样本之间的可比性?
[参考答案]
可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。
2、抽样中要求每一个样本应该具有哪三性?
[参考答案]
从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。
(1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。
(2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。
(3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。
由于个体之间存在差异, 只有观察一定数量的个体方能体现出其客观规律性。
每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。
需要作“样本例数估计”。
3、常见的三类误差是什么?应采取什么措施和方法加以控制?
[参考答案]
常见的三类误差是:
(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
这种差异是由抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。
四.综合题(每题15分,共30分)
1、某神经内科医师观察291例脑梗塞病人,其中102例病人用西医疗法,其它189 例病人采用西医疗法加中医疗法,观察一年后,单纯用西医疗法组的
病人死亡13例,采用中西医疗法组的病人死亡9例,请分析两组病人的死亡率差异是否有统计学意义?
[参考答案]
本题是两组频数分布的比较,资料课整理成下表的形式。
两组疗法病人的死亡率的比较
组别
死亡 存活 合计 西医疗法
13 89 102 西医疗法加中医疗法
9 180 189 合计 22
269
29
(1)建立检验假设并确定检验水准
H 0:π1=π2,即两组病人的死亡率相等 H 1:π1≠π2,即两组病人的死亡率不等 α=0.05
(2)用四个表的专用公式,计算χ2检验统计量χ2值
χ2
=
(ad −bc)2
n
(a +b)(c +d)(a +c)(b +d)
=
(13×190−89×9)2
×291
22×269×102×189
=6.041
(3)确定P 值,作出推断结论
以ν=1查附表的χ2界值表,得P <0.05。
按α=0。
05水准,拒绝H 0,接受H 1,可以认为两组病人的死亡率不等。
2、 雌雄两组分别给以高蛋白和低蛋白的饲料,实验时间自生后28天至84天止,计8周。
观察各组鼠所增体重,结果如下表,问两种饲料对雌鼠体重增加有无显著影响?
两种饲料雌鼠体重增加量(g )
高蛋白组 低蛋白组 83 65 97 70 104 70 107 78 113 85 119 94 123 101 124 134 146 161
107
[参考答案]
(1). 建立假设检验
H
:两总体分布相同
H
1
:两总体分布不同
α=0.05
(2). 计算统计量
将两样本21个数据由小到大统一编秩,见下表
两种饲料雌鼠体重增加量(g)
高蛋白组秩次低蛋白组秩次835651
97870 2.5 1041070 2.5 10711.5784 11313856 11914947 123161019 1241710711.5 1291812215
13419
14620
16121
172.5(T1)58.5(T2)T=58.5
(3)查表与结论
n 1=9,n
2
=12,n
2
-n
1
=3,按α=0.05,查T值表得范围71~127,因为
T=58.5<71,超出范围,故P<0.05,拒绝H
0,接受H
1
,接受两种饲料对雌鼠体
重增加有显著影响。