生物医学论文中统计结果的表达及解释【摘要】统计学是生物医学研究所必需的重要手段, 生物医学研究的实验设计、资料收集、数据处理分析以及结论都离不开统计学应用。
生物医学研究论文主要由摘要、引言、材料与方法、结果和讨论5个部分组成, 各个部分都涉及统计结果的表达和解释, 统计学是专业结论成立与否的重要依据。
统计学应用不当不仅影响论文的科学性, 还有可能得出错误的专业结论。
【关键词】统计学科研论文统计分析统计表达近年来, 统计学在生物医学科研中的应用越来越受到重视, 统计分析结果的表达及解释已成为医学科研论文中不可缺少的重要组成部分。
除论文涉及的专业(如细胞与分子免疫学杂志为免疫学专业)和表述的文字2个方面外, 统计学是评价论文质量优劣的重要依据, 然而国内生物医学论文中统计学应用仍存在着较为严重的问题[1-4], 如2003年某大学学报拟发表论著中统计方法误用率为57%[3]。
细胞与分子免疫学杂志虽然在国内生物医学系列杂志中具有较高的学术地位[5], 但拟发表及刊出论文在科研设计、统计学分析、结果解释等方面也不同程度地存在一些问题, 作者的统计学应用水平有待进一步提高。
许多生物医学杂志, 如国外著名杂志JAMA、新英格兰医学杂志(NEJM)和英国医学杂志(BMJ)等, 以及国内中华医学会系列杂志及细胞与分子免疫学杂志等, 对来稿都有统计学表达的基本要求或统计学指导原则。
国际生物医学杂志编辑协会在其《生物医学期刊投稿的统一要求》中也包含了统计学表达的基本要求。
生物医学研究性论文主要由摘要、引言、材料与方法、结果和讨论5个部分组成, 各个部分或多或少都涉及到统计结果的表达和解释问题。
例如在论文的“引言”部分需要给出文献复习的综合结果, 如文献报告的组间差别及P值等。
其他重要的统计表达和解释主要集中在论文的“摘要”、“材料和方法”、“结果”及“讨论”4个部分[6]。
1 摘要“摘要”中要有表示研究结果的重要统计指标(统计量)的数值、可信区间及假设检验结果(P值)。
如处理组和对照组的均数(中位数)、标准差(标准误)、率、P值, 或2组均数(率)之差、95%可信区间、OR值及多个观察指标的相关系数等。
这些数据是循证医学Meta分析的基本依据。
2 材料和方法“材料和方法”中的统计学描述包括以下两个方面。
2.1 描述研究设计的内容内容包括研究类型、观察对象类型、入选和剔除标准、观察方法和测量技术以及实验、试验或调查资料的搜集过程等。
尤其应具体地描述研究对象的来源和选择方法(如是否配对、随机抽样), 包括观察对象的基本情况、有无随机分组(随机抽样)、随机化分组方法、样本含量及其估计的依据等。
对于非随机化分组的观察性研究(含调查研究), 还应给出影响因素(如年龄、性别、病情)的均衡性分析结果。
对于临床试验, 还需要特别说明诊断标准、疗效评价标准、病例入选标准、病例剔除标准、依从性如何、有无失访及失访的比例、有无“知情同意”、疗效评价是否采用“盲法”(“单盲”、“双盲”或“多盲”)等。
2.2 描述统计分析方法与统计计算软件论文中用到的所有统计分析方法都要说明,且需指出在何处用了何种方法。
统计计算软件一般给出名称即可, 如SPSS、SAS等。
然而, 有些论文却把统计学当做“修饰物”, 论文中没有用到的统计分析方法也都一一罗列出来, 甚至有的形态学研究不需要统计学分析, 却也给出了“P值”。
在这里, 有些作者错误地认为, 只要给出了“P值”, 就标志用了统计学, 却不管统计学用得是否正确。
事实上, 误用或滥用统计学不仅不能提高论文的质量, 反而会大大降低论文的科学性!2.3 研究设计常见的主要问题(1)研究目的不分主次, 试图通过一次试验回答多个问题, 测量指标多, 样本小, 试验前未进行样本含量估计, 对研究对象的来源和选择方法不做任何说明或只做非常简单的说明, 统计分析方法没有任何说明, 尤其是一些特殊的统计方法。
例如, 动物实验没有随机化分组, 或只说明经随机化分组, 未说明具体的随机化分组方法(如完全随机、配对或分层随机分组等); (2)观察对比的研究轻率使用“随机选择对照”、“随机抽取健康儿童××例”等用语, 对比组间的均衡性未交代或组间不做比较, 只说明组间均衡, 未给出反映均衡性的统计指标的具体数据以及所用的统计分析方法; (3)临床试验没有报告伦理学要求对随机化分组的限制与改动、受试者的代表性、依从性、是否有失访等, 疗效评价未说明是否采用“盲法”, 或只说明采用了“盲法”, 未说明是受试者遮蔽还是评价者遮蔽等;(4)实验或试验的样本量非常小, 如每组3例, 却不说明任何理由等等。
3 结果统计学分析结果主要用统计指标(统计量)表示。
统计指标比较多且需分组比较时, 常常须借助统计图表。
3.1 统计量在生物医学论文中, 对不同类型的研究资料需用不同的统计指标进行描述。
对细胞与分子生物学实验中的常见观测指标, 如TRAIL表达、mRNA表达水平、光密度值(OD值)、吸光度值(A值)、百分比含量及抑制率等, 常作为计量数据(计量资料)进行统计描述与分析。
对于计量资料, 当资料为近似正态(或对称)分布时, 可用算术均数x和标准差s描述; 在没有变异指标或精确性指标的情况下, 不宜单独使用均数。
在“±”后直接写具体数值而无标准误或标准差的符号表示, 如16.4±2.3, 容易引起混淆。
配对t检验, 应给出差数的均数及标准误(或标准差)。
当资料为偏态时, 应采用中位数Md和四分位数间距QR来描述, 而不宜用x和s。
用非参数统计分析方法处理的资料, 数据的中心位置用中位数表示, 散布范围(如95%的散布范围)用百分位数表示。
此外, 若对原始数据进行了变量转换, 则原始数据的均数及标准差不能很好地反映数据的中心位置及其散布范围, 不必将其列出。
对于计数资料, 常用的统计指标有率和构成比(百分比)。
使用百分比时, 分母要交待清楚。
小样本资料不宜计算百分比。
实际工作中统计指标应用常见的问题有: 计量资料不管是否近似服从正态分布, 统统用x±s描述研究结果的数据特征; 分子生物学或细胞实验(如ELISA法、MTT法、RT PCR法、免疫细胞化学法、蛋白质印迹分析法等)数据用x±s表示, 其样本量(例数)n在“材料和方法”或“结果”中未交代; 计数资料统计指标率和构成比(百分比)容易混淆, 常将构成比误用为率来说明事物发生的强度; 率和构成比的分母太小, 却计算相对数来进行描述和比较。
分母太小时, 率(构成比)的可靠性不能保证。
因此, 在这种情况下, 宜直接用绝对数进行描述而不宜计算相对数。
当计量资料符合正态分布条件时, 约有68%的观察数据在x±s的范围内, 约有95%的观察数据在x±2s的范围内。
当数据不符合正态分布时, 就没有这些特征了。
3.2 假设检验的结果表达不仅要给出P值, 还要给出检验统计量的实际值, 如u值、t值、χ2值等。
描述统计量, 如均数、率、相关系数, 无论检验结果是否有统计学意义, 均应列出。
0.05水平是常用的检验水准, 但P为0.04或0.06时, 与0.05并无太大差别, 得出的结论也理应一致, 不应有本质上的差别。
用P>0.05作为不“显著”(统计学意义)的表达方式容易使读者(也包括作者)误解, 由于统计软件的普及, 因此提倡报告P的具体数值(精确P值), 如P=0.018或P=0.436等。
如果提供精确P值实在有困难, 应给出实际的χ2值、t值、F值和相应的自由度, 以便他人在Meta分析时转换为精确P值。
3.3 统计图表统计图表是研究结果统计表达的重要手段, 统计图便于读者直观了解研究结果, 并且提倡用图来显示个体值的散布情况, 如相关和回归分析的散点图。
同一个体值不同时间的重复测量值最好连成曲线, 不同组别的个体值(均值)随时间变化的曲线亦可标在同一个图上。
提倡采用误差条图(或线图), 但由均数加减标准误绘出的误差条图, 仅能描述68%的可信区间, 不能误解为95%的可信区间。
医学论文中要求采用“三线”表。
数值结果按列(行)放置, 位数要对齐, 不要出现交叉换行的情况。
不同类型数据(如均数、标准误)要有标目, 表中应列出相应的观察例数。
大量统计结果的表达要运用统计表或统计图, 实际应用中统计图表还存在一些问题,主要有: (1)图形类别的选择与资料性质不符; (2)纵横两轴的等距离尺度不代表等差数据(算术尺度)或等比数据(对数尺度); (3)无图例或标目; (4)条图的纵轴起点不为0、横轴的刻度为算术刻度、排列顺序未按指标值大小(或自然顺序)排列; (5)圆图各部分未按比例大小或自然顺序顺时针方向排列(其他项放最后)、起点位置不在12时或9时; (6)统计表的标目不明确, 主辞和宾辞倒置或混淆, 表中存在斜线或竖线, 数据为“0”、无数据或缺失数据时留有空白, 同一指标小数位数(精度)不一致、小数点(位)未对齐等图表不规范问题。
3.4 数据精确度一般来说, 数据精确度只要足以区分个体差异即可, 并非小数位数越多越好。
表示观测结果时, 2个数的小数位数应一致, 如5.4±0.62, 应写成5.4±0.6, 平均值(x)与标准差(s)的位数, 除取决于测量仪器的精密度外, 还取决于样本内个体的变异, 一般按s3而定, 例如(3825.3±610.6) g, 其中s3超过200 g, 平均值在百克的位上波动, 故应写成(3.8±0.6) kg。
与实际情况不符的精确度并不能增加论文的价值, 反而降低了论文的可读性与可信程度。
从计算器或计算机得到的计算结果需要四舍五入。
计量资料的统计指标(x、s、中位数、百分位数等)要保留的小数位数, 应该与原始数据记录的小数位数相同。
均数的有效位数通常不应比原始数据的有效位数多, 但标准差或标准误必要时需多增加一个位数。
计数资料的百分比保留1位小数, 一般不超过2位小数; 病死率、发病率按惯例选择比例基数, 如1000‰, 10000/万和10万/10万等, 或自行选择合适的比例基数, 使率的整数部分至少有1位有效数字; 相关系数保留2位小数; 精确概率P值一般没必要给出四位小数, 有时甚至保留两位小数也可以; 检验统计量, 如χ2值、t值保留2位小数即可。
当样本数小于100时, 小数位数的多少并不能增加精确度, 应避免取过多的小数位数。
注意, 以上要求仅适用于表达最终的统计结果, 数据在分析之前或分析过程中不能舍入。
在表达t值、χ2值或r值时, 有2位小数就足够了。
3.5 常用统计专业术语一些常用的统计专业术语, 要注意不能作为普通名词使用, 如参数(parameter)、可信区间(confidence interval)、相关(correlation)、发病率(morbidity)、患病率(prevalence rate)、非参数法(non parametric statistics)、百分位数(percentile)、灵敏度(sensitivity)、特异度(specificity)等。