医学统计学课程思考题及答案(注:红色字体表示已经改正,多余表示删除的内容)一.名词解释1.Population and Sample总体:根据研究目的确定的同质研究对象某观测值的集合。
样本:从总体中随机抽取的有代表性的部分研究对象其观测值的集合。
2.Cross-over design交叉设计:每个受试者随机地在两个或多个不同试验阶段分别接受指定的处理(试验药或对照药)。
3.Variance方差:离均差平方和的均数,反映一组同质计量资料的离散趋势大小。
4.Power of test检验效能:常用1-β表示,其意义是当两个总体存在差异时,使用统计检验发现总体间差异的能力,一般在0.8左右5.Relative ration相对数、相对比:二.选择题1、分析母亲体重与婴儿的出生体重的关系,宜绘制( C )A. 直方图B. 圆图C. 散点图D. 直条图2、统计推断包括( D )A、统计描述B、参数估计C、估计抽样误差D、参数估计和假设检验3、两样本率比较,经χ2检验,差别无显著性时,P值越大小,说明(B C )A.两样本率差别越大B.两总体率相同的可能性越大C.越有理由认为两总体率不同D.越有理由认为两样本率不同4、调查某地1000人,记录每人的血压值,所得的资料是一份( B A)。
A、计量资料B、计数资料C、还不能决定是计量资料还是计数资料D、可看作计量资料,也可看作计数资料5、某医师用A药治疗25例病人,治愈20人;用B药治疗30例病人,治愈10人;比较两药疗效时,可选用的最适当的方法是( A )。
A、χ2检验B、 u检验C、校正χ2检验D、确切概率法χ2检验:推断两个或两个以上总体率(或构成比)之间有无差别及两分类变量间有无相关关系等。
因为T=25*25/55>=5,n>=40,所以采用四格表专用公式。
u检验:两完全随机设计两总体均数比较,样本量很大,且总体的方差已知。
校正χ2检验:1<T<5,n>=406、若对照组的样本含量为10,实验组的样本含量为20,观察指标为计量资料,则做两样本均数比较t检验时,其自由度为( C )。
A、 30B、 29C、 28D、 27n1+n2-27、某项关于某种药物的广告声称:“在服用本制剂的1000名上呼吸道感染的儿童中,有970名儿童在72小时内症状消失。
”因此推断此药治疗儿童的上呼吸道感染是非常有效的,可以推广应用。
这项推论是( C )。
A .正确B .不正确,因所作的比较不是按率计算的C .不正确,因未设对照组或对比组D .不正确,因未作统计学假设检验8、两个小样本计量资料的比较,首先应考虑( D )。
A .用t 检验B .用秩和检验C .t 检验或秩和检验均可D .资料符合t 检验还是符合秩和检验的条件 t 检验:单一总体t 检验时,要求样本相应的总体为正态总体配对t 检验时,要求每对数据差值的总体为正态总体两样本t 检验时,要求相应的两总体为正态总体且两总体方差相等,即方差齐性;如果方差不齐,则采用t ’检验秩和检验:非正态总体9、测定某地130名正常成年男子血脂,要估计该地成年男子血脂均数的95%可信区间是:( B )A .X s 96.1±μB .X s X 96.1±C .X σμ96.1±D .s X 96.1±10、四格表中四个格子基本数字是 CA . 两个样本率的分子和分母B .两个构成比的分子和分母C . 两对实测阳性绝对数和阴性绝对数D . 两对实测数和理论数三.简述题与问答题1. 简述医学统计中三种主要平均数的适用范围和条件算术平均数:适用于对称分布的资料,尤其是正态分布或近似正态分布的资料。
几何平均数:适合于观察值变化范围跨越多个数量级的资料,尤其是对数正态分布料。
中位数:各种分布类型的资料,特别适合大样本偏态分布资料或者一端或两端无确切数值、有特异点及分布不明确的资料。
众数:适用于大样本。
2. 简述假设检验中的两类错误和检验效能I 类错误:拒绝正确的无效假设,用a 表示,称为检验水准。
II 类错误:接受不拒绝错误的无效假设,用B 表示。
检验效能:统计学中用1-B 表示,其意义是当两个总体存在差异时,使用统计检验发现两个总体差异的能力,通常检验效能在0.8左右以上。
3. 观察30名贫血患者用铁剂治疗后红细胞增加数,其总体的同质基础是什么?如何描述治疗后红细胞增加数分布的变异程度。
同质基础:贫血患者和铁剂治疗如何描述:用标准误来描述。
描述一组同质变量值分布的变异程度:可以采用标准误这个指标,反应的是随机抽样引起的统计量与总体参数,统计量与统计量之间的差异。
用标准差或四分位间距表示4. 下面的回归方程来自对16个诊断为糖尿病患者的研究,他们接受某种治疗已一年x y29.034ˆ+-=(Y是病人开始治疗之后一年里所减轻的体重,X是病人治疗开始时的体重。
)请在这项研究资料的基础上做出合理的解释。
从预测的角度,通过样本数据在最小二乘法原则下建立线性回归方程,以便用自变量(X)的数值估计反应变量(Y)的数值及变异。
-34代表在没有自变量x影响时,其他各种因素对因变量Y的平均影响;0.29代表自变量x每改变一个单位,Y便改变0.29个单位。
用于预测时候,必须是在X的取值范围内。
5.某地抽样调查了10000名正常成人男性的血压值(近似正态分布)。
结果如下收缩压的均数=110,标准差=11,舒张压的均数=73,标准差=11 (单位:mmHg)问:(1)从中随机抽取一人,测的其舒张压在73±1.96×11这一范围内的可能性为多少95% 99%===2.58(2)若以舒张压≥95为高血压,试按正态分布原理估计这10000人的高血压患病率约为多少?1- Ѡ(95-73 /11)=1-Ѡ(2)=2.28%(3) 试以95%的概率估计当地全体成年人收缩压均数的范围。
110±1.96×11(4) 试比较样本收缩压与舒张压的变异程度是否相同?为什么不同,算CV,收缩压CV=10.00%,舒张压CV=15.07%。
变异系数CV=S/(X的平均值)*100%,用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异程度。
6.血铅浓度升高可能与肾功能不全有关。
54名血清尿素升高的病人及按年龄、性别配对的54名对照者的血铅均数、中位数和众数如下:集中趋势的指标(μmol/L)血清尿素升高的对象对照者均数 1.73 1.33中位数 1.44 1.31众数 1.25 1.25(1)这两组集中趋势指标告诉我们这两个分布呈什么形状?血清尿素升高的对象是正偏态分布,对照组是正态分布。
(2)如何比较两组间平均血铅的差异?用什么方法?符号秩检验:检验配对数据的差值是否来自具有相同分布的总体。
配对t-test或秩和检验四.分析题血压有时升高有时正常的病人引起一个复杂的问题。
研究对象是男人,它们至少有一次收缩压超过140mmHg或舒张压超过90mmHg,并且在多次看门诊时至少有一次读数在140/90mmHg以下。
以年龄相仿而血压从未超过140/90mmHg的男人为对照组。
高血压组中找出了一个亚组,这个亚组是由在家测量的血压转为正常的男人组成的。
我们的兴趣在于确定非稳定型高血压病人可用以与血压正常者相鉴别。
(1)将下表的各项测量值算出95%可信区间。
不同血压分组对象的临床特征(均值或比例±SE)特征门诊检查正常者(N=49)门诊检查可疑在家正常者(N=31)体重(公斤)70.6±1.5 81.3±1.9心率(每分钟心跳数)70.9±1.4 83.1±2.1家族史阳性(%)24.4±6.1 41.9±8.9可信区间:X一把加减1.96*SE(2).你认为哪些特征的差异太大因而不能单纯用“抽样误差”来解释?为什么?下列规则用于确立哪些可疑高血压病例可以认为是在家时读数正常的人。
当某人在家读数与那些门诊收缩压与舒张压正常者(对照组)在家读数的均数相比,不超过一个标准差者,则将他分到在家读数正常组中。
(3).此规定的理论根据是什么?分析:(1)各组的95%CI计算如下:特征门诊检查正常者(N=49)门诊检查可疑在家正常者(N=31)体重(公斤)67.66-73.54 77.58-85.02心率(每分钟心跳数)68.16-73.64 78.98-87.21家族史阳性(%)12.44-36.36 24.95-59.34(2)体重与心率特征在两组间差异太大,因95%CI不重叠,所以其差异不能单纯用“抽样误差”来解释(3)此规定的理论依据为:根据正态分布的原理,不超过一个标准差占68.27%,因此当某人在家读数与那些门诊收缩压与舒张压正常者(对照组)在家读数的均数相比,不超过一个标准差者,则将他分到在家读数正常组中。
(4).来自同一总体的两个样本中,_D_小的那个样本均数估计总体均数时更精确。
(A)S (B)R (C)CV (D)(5)17.等级资料的比较宜用 C(A) t检验 (B)检验(C)秩和检验 (D)方差分析(6)20.同一双变量资料,进行直线相关与回归分析,有 B(A) r>0 , b<0 (B) r>0 , b>0 (C) r<0 , b>0 (D) r=b(7)统计资料按其性质不同,通常将资料分为(计量、计数、等级) 三种类型。