医学统计学案例辨析及参考答案非凡文印提供松园7号楼目录目录 (2)第1章绪论 (3)第2章统计描述 (5)第3章概率分布 (9)第4章参数估计 (12)第5章假设检验 (14)第6章两样本定量资料的比较 (16)第7章多组定量资料的比较 (19)第8章定性资料的比较 (22)第9章关联性分析 (25)第10章简单线性回归分析 (27)第11章多重线性回归分析 (31)第12章实验设计 (34)第13章临床试验设计 (36)第14章调查设计 (37)第15章样本含量估计 (39)第16章随机区组设计和析因设计资料的分析 (42)第17章重复测量设计和交叉设计资料的分析 (44)第18章 Logistic回归 (47)第19章生存分析 (51)第20章对数线性模型在高维列联表资料分析中的应用 (54)第21章多元统计方法简介 (57)第22章时间序列分析 (58)第24章基因表达谱分析的生物信息学方法 (60)第25章 Meta分析 (61)第26章医学论文的统计学报告要求 (65)第1章绪论案例辨析及参考答案案例1-1某研究者的论文题目为“大学生身心健康状况及其影响因素研究”,以某地职业技术学院理、工、文、医学生(三年制)为研究对象,理、工、文、医学生分别挑选了60、38、19和46人,以问卷方式调查每位学生的一般健康状况、焦虑程度、抑郁程度等。
得出的结论是:“大学生身心健康状况不容乐观,学业问题、就业压力、身体状况差、人际交往不良、社会支持不力为主要影响因素”。
请问其结论合理吗?为什么?应该如何?案例辨析①样本不能代表总体。
总体是“大学生”,而样本仅为某地三年制职业技术学院学生;②社会学调查的样本含量显得不足;③“理、工、文、医学生分别挑选……”这种说法中隐含人为“挑选”的意思,不符合统计学要求。
正确做法应在论文的题目中明确调查的时间范围和地点,还应给“大学生”下一个明确的定义,以便确定此次调查的“总体”;对“大学生身心健康状况”可能有影响的因素很多,应结合具体问题拟定出少数最可能有影响的因素(如学科、在学年限等)进行分层随机抽样,以保证样本有较好的代表性;还应根据已知条件找到估计样本含量的计算公式,不可随意确定各学科仅调查几十人;当然,调查表中项目的设置也是十分重要的,此处从略。
案例1-2两种药用于同一种病,A药治疗5例,4例好转;B药治疗50例,36例好转。
结论是:A药优于B药。
请问其结论合理吗?为什么?应该如何?案例辨析①A药样本仅5例,样本含量太少;②得出“A药优于B药”没有交待是否采用了统计学推断方法,若用目测法得出结论,则结论没有说服力;③未明确研究目的和研究结果将被使用的范围。
正确做法①应明确研究目的和研究结果将被使用的范围,若是个别研究者或临床医生想了解这两种药的大致疗效,属于小规模的临床观察,其结论仅供少数人在今后临床实践中参考,其样本含量可能不需要很大,因为观察指标是定性的(有效、无效),一般来说,每个药物组也需要几十例(以不少于20例为宜);若属于新药的Ⅱ期临床试验,那就要严格按有关规定,比较准确地估计出所需要的样本含量,不仅如此,还有很多严格的要求,详见本书中临床试验设计一章;②从明确定义的总体中随机抽样进行实验研究,得到的实验结果不能仅凭数据大小作出判断,应进行假设检验,以提高结论的可信度。
案例1-3某研究者为了探讨原发性高血压患者肾小管早期损害的监控指标,选取尿常规、蛋白定性检查阴性,血肌酐、尿素氮均在正常范围内的原发性高血压患者74例作为病例组,其中男43例,女31例,平均年龄61岁(40~73岁)。
根据高血压的病程将患者分为三组,Ⅰ组高血压病期<10年,Ⅱ组高血压病期10~20年,Ⅲ组高血压病期>20年。
另选取53名体检健康的职工为对照组。
观测两组尿视黄醇结合蛋白(retinal binding protein, RBP )、微量白蛋白(microalbumin, mALB)、β2 微球蛋白(β2 microglobulin, β2-MG)和N -乙酰-β-D-氨基葡萄糖苷酶(N -acetyl-β-D-glucosaminidase, NAG)四项定量指标的取值。
结论为:尿RBP 、mALB 、β2-MG 和NAG 是原发性高血压患者肾小球、肾小管早期损害的敏感指标。
请辨析这样设计实验存在什么问题?正确的做法是什么?案例辨析 研究对象的选取在病例组和对照组之间存在不均衡性,即两组受试者之间,除了一组患有高血压,另一组未患高血压以外,在其他很多与评价高血压可能导致坏影响的方面都不一致。
对照组选取的是53名体检健康的职工,未明确写出平均年龄以及年龄所在的范围,也未交代性别构成情况。
但由我国现行的退休制度可知,在职职工的年龄通常在18~60岁之间,平均年龄大约40岁。
由临床医学基本常识可知,很多因素(比如年龄、性别等)不仅对血压有影响(通常是随着年龄的增大,血压有升高的趋势),而且对肾功能也有一定程度的影响;况且,高血压患者与健康职工还在“体力和脑力劳动强度、生活方式、心理和精神的紧张程度等诸多方面不具有可比性,而这些重要的非实验因素可能对肾功能也存在不同程度的影响。
总之,原研究者所选取的病例组与对照组在很多重要的非实验因素方面(特别是年龄)不具有可比性,降低了结论的说服力。
正确做法 欲探讨高血压早期肾损害的监控指标,应根据高血压患者病程所分的三个组确定受试者的年龄段,从患者所取自的人群范围内随机选取一定数量的正常健康人(而不应仅局限在原研究者所在单位内),将正常健康人也分成相应的三个年龄段,并应尽可能确保在每个年龄段中,病例组与对照组受试者在其他重要非实验因素方面(如性别构成、体力和脑力劳动强度、生活方式、心理和精神的紧张程度等)均衡一致,采用相应的统计分析方法去比较定量指标的测定结果之间的差别,其结论才具有较高的可信度。
案例1-4 某部队共有1 200人,在某段时间内患某病的人数有120人,其中男性114人,女性6人。
某卫生员进行统计分析后说,经假设检验,该病的两性发病率(114/120=95%与6/120=5%)之间的差别有统计学意义,由此得出结论:“该病男性易得”。
你对这个结论有何看法?若结论是错误的,那么,错误的实质是什么?正确的做法是什么?案例辨析 这个结论是错误的!因为在这1 200人中,究竟有多少男性和多少女性并不清楚,无法计算男性发病的频率和女性发病的频率。
假如其中有1 194名男性和6名女性,则男性发病率为(120/1 194)⨯100% = 10.05%,而女性全部发病(女性总例数太少,不宜用百分之百发病率来描述)。
显然,原来的结论是不成立的。
该卫生员所犯错误的实质是将发病人员中性别的频率错误地当作人群中发病的频率了,因而得出毫无根据的错误结论。
正确做法 若这1 200人是从一个总体中抽出来的样本,要弄清在这1 200人中男、女人数各是多少,设分别为男n 和女n ,然后,分别计算男性和女性的发病频率,即%100120⨯=男男n P ,%1006⨯=女女n P ;要想得出两个发病频率之间的差别是否能反映总体的情况,还应进行统计推断(即进行假设检验,此处从略)。
第2章统计描述案例辨析及参考答案案例2-1本章的例2-1中,该医生同时还观察了1 402名临产母亲的住院天数(教材表2-14),并得到平均住院天数为6.6天。
请对此发表评论。
教材表2-14 1 402名临产母亲生产期间的住院天数组段(1)组中值X i(2)频数(3)频率f i(4)1~ 2 79 5.633~ 4 316 22.545~ 6 559 39.877~ 8 243 17.339~ 10 89 6.3511~ 12 57 4.0713~ 14 23 1.6415~ 16 19 1.3617~ 18 9 0.6419~ 20 1 0.0721~ 22 2 0.1423~ 24 2 0.1425~ 26 3 0.21合计— 1 402 1.00由加权法的计算公式(2-2)求出平均住院天数661002264001244225430562.....X=⨯+⨯++⨯+⨯= (天) 案例辨析首先观察资料的分布形式,由于呈正偏峰分布,选用上述结果描述住院天数的平均水平不合适。
正确做法宜选用不受定量资料分布情况限制的中位数来描述住院天数的平均水平。
本例计算结果为M =6.1(天)。
案例2-2某人编制了一张统计表(教材表2-15), 你认为哪些需要改进?案例辨析原表格存在的问题:①标题不准确;②线条过多,出现了斜线、竖线和多余的横线;③数字区域出现了文字;④小数位数不统一,小数点没有纵向对齐;⑤量纲的标注位置有误。
正确做法将原统计表中存在的上述错误纠正过来,修改后的统计表见案例表2-1。
案例表2-1 1976—1979年吉林市各年龄组人群部分恶性肿瘤死亡情况调查结果疾病各年龄组死亡率(1/10万)0~15~35~55~75~胃癌0.00 1.13 19.92 150.00 313.44 食管癌0.00 0.10 2.18 35.20 73.56肝癌肺癌0.340.001.640.4125.3020.2197.51125.10134.33137.53案例2-3某人绘制一张统计图(教材图2-11), 你认为哪些需要改进?教材图2-11 1952年与1972年某地肺结核、心脏病和恶性肿瘤的死亡率案例辨析原图形存在的问题:①缺标题;②复式条图误用为单式条图;③纵轴的量纲未注明;④未正确给出图例。
正确做法将原图中存在的上述错误纠正过来,重新绘图(案例图2-1)。
案例图2-1 某地三种疾病死亡率在1952与1972年间的变化案例2-4以病死率为考察指标,对两所医院某病的治疗水平进行比较,结果见教材表2-16,由合计的病死率得出结论为乙医院治疗水平优于甲医院,请评述这个结论。
教材表2-16 2000年两所医院某病的病死率比较病情严重程度甲医院乙医院出院人数病死数病死率/ % 出院人数病死数病死率/ %轻100 8 8.0 650 65 10.0中300 36 12.0 250 40 16.0重600 90 15.0 100 18 18.0 合计 1 000 134 13.4 1 000 123 12.3 案例辨析由教材表2-16可以看出,此表编制得不够规范,更为严重的是,虽然甲医院各种病情患者的病死率均低于乙医院,但总的病死率却是甲医院高于乙医院。
这个矛盾的出现,是由于甲医院收治的重病人多,轻病人少,乙医院则是重病人少,轻病人多。
两家医院收治患者的病情不均衡,不宜直接比较基于各自病情状况的病死率——“粗病死率”。
正确做法因各医院收治的患者在病情方面不均衡,直接进行比较是不正确的,而是要进行标准化处理后再比较。