卫生部“十二五”规划教材全国高等医药教材建设研究会规划教材全国高等学校教材供基础、临床、口腔医学类专业用《医学统计学》第6版习题参考答案主审马斌荣主编李康贺佳副主编杨土保马骏编者(按姓氏笔画排序)马骏(天津医科大学)杨土保(中南大学)尹平(华中科技大学)沈其君(宁波大学)方亚(厦门大学)易东(第三军医大学)刘艳(哈尔滨医科大学)贺佳(第二军医大学)刘启贵(大连医科大学)钟晓妮(重庆医科大学)吴骋(第二军医大学)钱聪(中国医科大学)张丕德(广东药学院)梁维君(湖南师范大学)李康(哈尔滨医科大学)学术秘书侯艳(哈尔滨医科大学)目录第一章绪论 (1)第二章定量数据的统计描述 (2)第三章正态分布与医学参考值范围 (5)第四章定性数据的统计描述 (6)第五章统计表与统计图 (8)第六章参数估计与假设检验 (10)第七章t检验 (11)第八章方差分析 (14)第九章卡方检验 (19)第十章非参数秩和检验 (23)第十一章线性回归与相关 (30)第十二章多元线性回归 (33)第十三章 logistic回归分析 (37)第十四章生存分析 (40)第十五章实验设计与临床试验设计 (42)第一章绪论一、单项选择题答案:1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D二、简答题1.答:由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。
2.答:医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。
统计设计能够提高研究效率,并使结果更加准确和可靠;数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等;统计描述用来描述及总结数据的重要特征;统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。
3.答:统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。
4.答:统计量是描述样本特征的指标,由样本数据计算得到;参数是描述总体分布特征的指标,可由“全体”数据算出。
5.答:系统误差、随机测量误差、抽样误差。
系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。
6.答:三个总体:一是“心肌梗死患者”所属的总体,二是接受尿激酶原治疗患者所属的总体,三是接受瑞替普酶治疗患者所在的总体。
(李康)第二章定量数据的统计描述一、单项选择题答案:1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E二、计算与分析1.[参考答案]3.43+2.96+4.43+3.03+4.53+5.25+5.64+3.82+4.28+5.254.26 (m m ol/L)10X==4.28+4.434.36 (m m ol/L)2M==2.[参考答案](1)编制频数表:表某地100例30-40岁健康男子血清总胆固醇值的频数表甘油三脂(mg/dL)(1)频数(2)累积频数(3)累积频率(4)110~ 2 2 2125~ 4 6 6140~11 17 17155~16 33 33170~27 60 60185~12 72 72200~13 85 85215~7 92 92230~ 5 97 97245~ 3 100 100合计100 --画直方图:图 某地100例30-40岁健康男子血清总胆固醇值的频数分布(2)计算均数和中位数:(110 +7.5) 2 +(125 +7.5) 4+(245 +7.53175.4(m g/dl)100X ⨯⨯⨯==)501000.53317015179.4m g/dl 27M P ⨯-==+⨯=()从上述直方图能够看出:此计量指标近似服从正态分布,选用均数较为合适。
(3)计算百分位数:51000.05212515136.25m g/dl4P ⨯-=+⨯=()251000.251715515162.5m g/dl 16P ⨯-=+⨯=()751000.757220015203.5m g/dl 13P ⨯-=+⨯=()951000.959223015239m g/dl 5P ⨯-=+⨯=()3.[参考答案]表 肝癌病人与正常人的血清乙肝表面抗原(HBsAg)滴度测定结果 滴度倒数 (X ) 正常人数 (f 1)肝癌病人数(f 2) lg X f 1lg X f 2lg X 8 7 1 2.08 14.56 2.08 16 5 2 2.77 13.86 5.55 32 1 3 3.47 3.47 10.40 64 3 2 4.16 12.48 8.32 128 0 1 4.85 0.00 4.85 256 0 1 5.55 0.00 5.55 合计1610-44.3736.751144.37lg1616G -⎛⎫=≈ ⎪⎝⎭,1236.75lg 3910G -⎛⎫=≈ ⎪⎝⎭正常人乙肝表面抗原(HBsAg)滴度为1:16 肝癌病人乙肝表面抗原(HBsAg)滴度为1:39 4.[参考答案]血催乳素浓度术前均值=672.4 ng/ml ,术后均值=127.2 ng/ml 。
手术前后两组均值相差较大,故选择变异系数作为比较手术前后数据变异情况比较合适。
术前:672.4X =,564.65S =564.65100%83.98%672.4C V =⨯=术后:127.2X =,101.27S = 101.27100%79.61%127.2C V =⨯=可以看出:以标准差作为比较两组变异情况的指标,易夸大手术前血催乳素浓度的变异。
(李康 侯艳)第三章 正态分布与医学参考值范围一、单项选择题答案:1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A 二、计算与分析1. [参考答案]已知12岁健康男童的体重近似服从正态分布,求体重在某个范围内的人数占总人数的比例,即是求此区间内正态曲线下的面积问题,可通过标准化变换,借助标准正态分布曲线下的面积求得比例;计算参考值范围应采用正态分布法。
①计算50X =所对应的z 值,5036.3 2.216.19X X z S--===,根据正态分布的对称性可知, 2.21z ≥右侧的尾部面积与 2.21z -≤左侧的尾部面积相等,故查附表1得( 2.21)0.0136Φ-=,即理论上该地12岁健康男童体重在50kg 以上者占该地12岁健康男童总数的1.36%。
②分别计算130X =和240X =所对应的z 值,得到1z =-1.02和2z =0.60,查附表1得( 1.02)0.1539Φ-=和(0.60)0.2743Φ-=,因此()()()()()()0.60 1.0210.60 1.0210.27430.15390.5718ΦΦΦΦ--=----=--=,即理论上该地12岁健康男童体重在30kg ~40kg 者占该地12岁健康男童总数的57.18%。
③查附表1,标准正态分布曲线下左侧面积为0.10所对应的z 值为-1.28,所以该地80%的12岁健康男童体重值集中在区间 1.28X S ±内,即28.38kg ~44.22kg 。
④可用正态分布法来估计参考值范围,应计算双侧95%参考值范围:()0.05236.3 1.96 6.1924.17,48.43X z S ±=±⨯=kg即该地12岁健康男童体重的95%参考值范围为24.17kg ~48.43kg 。
2. [参考答案]题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。
又因血铅含量仅过大为异常,故应计算只有上限的单侧范围,即95P 。
首先要找到95P 所在组段,由于200×5%=10,表示有10个数值要大于95P ,根据累积频数或累积频率都可以判定出95P 在1.68~组段,95 1.68L =,954f =,0.24i =,188L f =∑,故()95P =1.68+(20095%188)40.24 1.80mol /L ⨯-⨯=μ,即该地正常成年人血铅含量的95%参考值范围为小于1.80mol /L μ。
(刘 艳)第四章 定性数据的统计描述一、单项选择题答案:1. A 2. C 3. D 4. D 5. E 6. E 7. E 8. A 9. D 10. E 二、计算与分析1.[参考答案]不正确,因为此百分比是构成比,不是率,要知道男女谁更易患病,需得到1290名职工中的男女比例,然后分别计算男女患病率。
2.[参考答案]不正确,此为构成比替代率来下结论,正确的计算是用各年龄段的死亡人数除各年龄段的调查人数得到死亡率。
3.[参考答案]不正确,此为构成比替代率来下结论,正确的计算是用各型肝炎的新病例数除以同时期内可能会发生该病的人群人口数得到发病率。
4. [参考答案]两个煤矿的工人尘肺标准化患病率(%)工龄(年)标准构成甲 矿乙 矿原患病率预期患病人数原患病率 预期患病人数0~ 15018 0.86 129 0.20 30 6~ 6190 3.92 243 0.42 26 10~30355612.4344211.54410合计 24764814466甲矿尘肺标准化后患病率=24764814⨯%29.3%100= 乙矿尘肺标准化后患病率%88.1%10024764466=⨯=甲矿尘肺患病率高于乙矿尘肺患病率。
5.[参考答案]消除年龄构成影响后两地死亡率的比较年龄(周岁) 标准人口数甲地区乙地区原死亡率(‰)预期死亡人数原死亡率(‰) 预期死亡人数0~ 7000 20 140 30 210 25~ 6000 40 240 50 300 65~ 7000 60 420 70 490 合 计200008001000甲地区标准化后的总死亡率为:800100020000‰40P =⨯='甲‰ 乙地区标准化后的总死亡率为:1000100020000‰50P =⨯='乙‰可见,甲地区标化后的总死亡率低于乙地区标化后的总死亡率。
(马 骏)第五章 统计表与统计图一、单项选择题答案:1. E 2. D 3. B 4. E 5. D 6. E 7. E 8. E 9. E 10. D 二、改表和绘图 1.[参考答案]本表的缺点有:(1)无标题,(2)横表目与纵标目分类不明确,标目设计不合理,“合计”不清晰,不便于比较分析;(3)线条过多,比例数小数位不统一。