当前位置:
文档之家› 医学杂志论文中常见的统计学错误分析及对策
医学杂志论文中常见的统计学错误分析及对策
(1)忽视了t检验的使用条件;
(2)多个样本均数比较错误地用多个t 检验代替 方差分析;
(3)误用t检验分析重复测量设计资料
单样本t检验的应用条件:样本服从正态分
布;
成组t检验的应用条件:样本服从正态分布;
两样本的总体方差相等即方差齐性。
配对t检验的应用条件:差值服从正态分布。
这类错误是临床医学科研论文中定量资料分析中最 常见的错误, 而且是原则性错误, 会增加犯第一类 错误的概率。假设检验的案例一资料为不同年龄组 不同性别基础能耗情况, 原作者用t检验分别对各 组均数逐一进行比较, 得出在男女研究对象青年组 与中年、老年组的基础能耗差异有足够的样本作 前提,要在文章中描述清楚随机抽样的抽样总体、样本含 量、抽样方法,随机分组的随机方法、各组的样本含量与 基本特征等。医学科研论文中最普遍的问题是滥用“随 机”,只要是抽样或分组,不管实际是否采用了随机的方 法,在论文中均不谈采用了什么样的随机方法,就将“随 机”写上,将随机误解为随意、随便、不采用随机化处理 方法,导致结果缺乏可靠性。
某研究者为了研究三种不同值班情况孕妇的 早产发生情况, 作者在计算平均率时, 错误地将几 个率相加后取其平均值, 这种类型的错误也是临床 科研论文中常见的错误之一。
如计算计数资料的案例二中三种值班女工的 早产的合计发生率( 即平均率)时, 以( 2. 7+ 4. 8+ 10. 3) /3= 5. 9, 即平均发生率为5. 9%。
(2)统计图方面的主要错误有两个,其一,横坐标轴 上的刻度值不准确,等长的间隔代表的数量不等;在 直角坐标系中,从任何一个数值开始作为横轴或纵轴 上的第一个刻度值。其二,用条图或复式条图表达连续 性变量的变化趋势;
(3)统计表中数据的含义未表达清楚,令人费解;
(4)运用相对数时,混淆“百分比”与“百分率” ;
二是用P>0.05错误地支持“两种干预措施效果相
同”或“两种检测方法可以互相替代”等结论。实际
上,由于样本含量小,检验效能不够,容易得到P>0.05
的结果。
因此,提倡在试验前进行样本含量大小的估计。
谢谢!
感谢下 载
在医学论文中,有些P>0.05的“阴性结果”,样本含
量不够致检验效能不足是一个主要的原因。实验之 前不进行样本含量估计会带来两个问题:一是杂志上
论文的发表偏倚,即当实验结果出现P<0.05的阳性结 论,寄交杂志社发表,若出现P>0.05的阴性结论,则锁
进抽屉,以至于有些医学期刊几乎找不到阴性结果的 研究论文。
正确的算法是: ( 94 /1547) × 100% = 6. 1%。
定量资料进行假设检验的方法很多, 其常见错误 是:
(1)忽视t 检验和F (方差分析) 检验的前提条 件;
(2)误用t检验代替F 检验; (3)误用参数检验代替非参数检验; (4)各种方差分析混用。
计数资料统计分析的常见错误是: (1)错误选择了四格表卡方检验方法, 未选用 Fisher精确检验; (2)等级变量资料一律地使用卡方检验。
这种检验方法有误, 因为该资料为多组基本均 数间的比较, 正确的方法是用单因素方差分析, 只 有在方差分析有显著性的基础上有必要再作均数间
的两两比较, 用q检验, 而不是t检验, 同时假设检 验的案例一中应该列出方差分析的统计量F值及具体 的P值。
重复测量数据是指同一受试对象的同一指标在不同时 间点上进行多次测量所获得的资料, 常用来分析某项 观察指标在不同时间点上的变化特点, 这类资料在临 床试验中较为常见。本案例是两种不同处理方案对病 人血浆ET 浓度( pg /m l)变化比较, 分别在麻醉前 、术毕、术后24 h、术后48 h测量病人血浆ET浓度, 观察两种处理方案对病人血浆ET浓度的影响及变化趋 势。
出具体的统计量及P 值。
(1)错误地将构成比当作率使用 (2)错误地计算平均率 (3)计算相对数时分母过小
研究者对计数资料的案例一资料进行分析, 认为 “轮状病毒腹泻的发病率最高为43.1%,痢疾次之28. 8%, 伤寒最低为13. 1%” 。这是将构成比当作发病率 使用的典型错误, 是临床科研中最常见的错误之一。
原文作者用配对比较t检验对不同时间两个处理方 式血浆ET浓度的差异进行检验, 发现有统计学差异, 并 认为A 组术后ET浓度相对稳定, 术后无明显升高。我们 认为资料的统计处理不恰当, 因为这时一个典型的重复 测量的多个样本均数的比较, 故应该采用重复测量方差 分析检验不同处理组间和时间因素及处理因素与时间的 交互效应是否具有统计学意义, 如果差异有显著性, 然 后再作两均数间的两两比较。
本案例反映不同分娩方式重症肝炎孕妇结局的 比较。
原作者使用一般四格表卡方检验, 得: 卡方值=
7. 24, P = 0. 007; 但观察了22例, 总例数小于40,
不适合使用一般卡方检验。应用
Fisher精确概率检验法。
本例正确的计算结果为P = 0. 011(双侧概率)。很多
分析人员认为两种方法分析的结果都是认为不同分娩 方式重症肝炎孕妇结局有差别, 但统计学意义是不一 样的, 因为P 值大小不一样, 拒绝和不拒绝无效假设 的概率是不一样的。
本文作者将资料中三个等级中的“有效”和“显 效”合并, 使之成为二分变量。然后, 用四格表卡方
检验, 得卡方值 =3.302, P=0.069, 作出两组治疗总
有效率差异无统计学的结论。原统计分析中将三个等 级合并为两个等级, 导致信息丢失, 结果得出两处理 组总疗效无显著性差异的结论。
从本案例中可见到对照组“有效”的构成比为 28.57%,高于治疗组的“ 有效”构成比17.64%, 而 治疗组“ 显效”构成比76.47% 高于对照组“显效” 构成比50.00%, 另外显效与有效在临床上都是表示治 疗的有利效果, 盲目合并会导致错误的结果。
有些文章虽然设立了对照组,却使用非同期对 照或历史对照,组间的基础状况如性别、年龄、病情 等不一致,缺乏可比性。还有些作者虽然设立了正常 对照组,在分析的时候却未考虑,使该设计失去了原 有的意义。
研究的实验单位要达到一定的数量,才能避免将 个别情况误认为普遍情况,将偶然性或巧合的现象当 成必然的规律,以致将实验结果错误地推广到群体。
实际上表中所提供的信息, 只能用来说明在该腹泻门 诊就诊的521例病人中, 各种腹泻病人所占的比重, 并不能反映出各自发病率的高低, 而且计数资料的案 例一所列的% 号也未指明是构成比还是发病率, 容易 引起歧义。正确的描述应该是在腹泻门诊病人中, 轮 状病毒引起的腹泻所占的比例最高, 伤寒最低。
各项指标的均数均大于2倍标准差, 说明资料为 偏态分布, 用均数、标准差描述资料的集中趋势和离散 程度显然是不妥当的,
案例一中只列出P 值, 也未说明具体的统计学方法
。
正确的做法应用中位数描述集中趋势, 用四分位数 间距表示离散程度。或者是将原始数值经对数等转换后, 再计算转换值的平均数和标准差, 同时在表格中应该列
随机化原则是由Fisher在创建实验设计理论的 过程中首先提出的,随机化原则是实验研究中保证取 得无偏估计的重要措施。随机化方法由最初的抽签 、掷硬币和抓阄等方法发展到随机数字表、随机排 列表和用计算机软件或计算器产生的伪随机数。
医学研究,尤其是实验设计的研究,需要设立 合适的对照组,只有设立了对照,才能消除非处理因 素对实验结果的影响,从而将所关心的处理因素的 效应分离出来。在论文中应说明对照取自的总体, 如何得来的,样本含量多大? 是否与实验匹配或配 伍,与试验组的均衡性如何?
正确显著性检验方法应该 用Ridit分析 或者非参数检验(秩和检验) 或者CMH检验 或者Logistic回归分析
本案例采用秩和检验分析, z= 2.27, P = 0.023,
差异有统计学意义, 说明治疗组的疗效优于对照组。
(1)随机分组与随机抽样没有真正遵循随机化原 则;
(2)无对照或对照设计不合理; (3)样本含量太少。
同济大学医学院 医学统计学教研室 艾自胜 2014-9-28
(1)描述性分析中的常见错误 (2)假设检验中常见的统计学方法选择错误 (3)研究设计中的常见错误 (4)纠正错误的对策
在医学论文中,对不同类型的研究资料需要 用不同的统计指标进行描述。实际工作中统计指标 选择常见的问题有:
计量资料无论是否服从正态分布,统统用均 数±标准差描述研究结果的数据特征;
计数资料混淆率和构成比(百分比)的概念,常 将构成比误用为率来说明事物发生的强度;率和构 成比的分母太小,却计算相对数来进行描述和比较 。
(1)误用正态分布的描述性统计指标描述呈偏态分布 的资料(标准差>均数 )仍采用“ 均数±标准差”表 示,特别当表中采用标准误 取代标准差s时,前述的 错误很难被察觉出来 ;