科研设计与统计常见错误解析
科研设计与统计常见错误 解析
中日友好医院 李光伟
一、选题
临床科研系指以病人为研究对象的医学科学研究 其目的是为了提高诊断水平和治疗效果,改善预 后和对疾病病因做宏观研究。
选题是临床科研的起点 体现科研设计和实施的指导思想 影响临床科研工作的全过程 因此在科研过程中自始至终处于主导地位。 从这个角度来说,选题比科研方法更重要。
选题必须具有科学性。所提出的新问题、新假 设、新思路必须要符合客观规律。 临床实践是临床科研选题的源泉: 在日常临床实践中,人们无时无刻不面临着许 多诊断、治疗、病因和预后估计等问题,诊断 方法和治疗措施有待于科学的系统评价,这些课 题其中不少可能具有较高的研究价值 临床医学已发展成为一门综合性的学科,不 仅涉及生物医学,而且涉及临床经济学和医学 社会等,这一方面有许多有待研究的临床问题。
妇女健康倡议研究(WHI)
-----再好的研究也有缺陷! 忽略了HRT最明显的益处: (缓解更年期症状,治疗泌尿生殖道萎缩,防止骨质疏松) 没有遵照处方药应该严格掌握适应症的原则(性激素低下 而非所有老年妇女,更不是健康老年妇女。该研究中80%以 上是没有绝经期症状的老年妇女。不具有HRT适应症 结论不应随意扩大(品种,剂量,种族) 与某些风险相比WHI所阐明的HRT对各种事件的绝对风险是 很低的
选题就是要正确地发现和提出问题 这些问题有的来自于临床实践 有的来自文献资料 所谓正确就是这些提出的问题要符合科学的认识规律
提出新问题、新假设比完成一项科研工作更难 没有好的科研假设,再好的科研方法也不会有好的科 研成果。
例: 提出新问题
医生的共识----冠心病来自已知危险因素。 但是无已知危险因素的人为什么发生冠心病? 冠心病人群血同型半胱氨酸水平显著升高, 那末同性半胱氨酸是否是冠心病新的危险因素? 使之下降发生冠心病危险是否会下降?
(1)、描述性统计
描述性统计分析是统计检验的基础,能提供资 料的总体特征,不论在最后的论文报告中描述性 统计分析的结果占多大的比重,它都是实际的资 料分析过程中的起点 它为选择进一步的分析方法如选择合理的变量 提供重要的信息, 发现原始资料中的错误
忽略必须的描述性统计分析 是导致统计方法应用不当的原因。
为保证科研的成功 , 一个完整的科研设计应 包括以下几项内容:
有理论或实用价值的选题 选择合适的研究对象 制定可靠的测量指标 选择科学的统计分析方法
若能对结果做恰当的描述,则会得出符合实 际的结论。
随机化分组在大多数情况下十分重要, 但随机化并非总是有利的和有道理的。
在某些情况下有比随机化更重要的东西那 就是要满足适应症的要求。 适应症不合理,随机化反使结果变糟。
现在大多数的国际医学刊物发表的论文中要 求作者同时给出点估计、区间估计和具体的检验 统计值,如相对危险度(Relative Risk , RR, RR值 就是暴露人群发病机与非暴露人群发病机率之比, 即a/(a+b)与c/(c+b)之比),RR的95%可信限和P值。 诸如95%可信限的区间估计可以提供更多有价值 的信息 但在我国临床科研的统计学应用中尚未引起足 够的重视。片面地认为越复杂的统计方法越好, 而忽视统计检验方法的适用性和恰当性。
变量的梯度是成功的关键。
4、设定恰当的入选和排除标准
恰当的入选和排除标准 可防止混杂因素的干
扰,保证研究结果的科学性,这是在各项研 究遵守的。
例如,看血压与胰岛关系,不可纳入有心功障碍 及肾病患者,否则可结果会有偏差。
4、设定恰当的入选和排除标准
入组的研究对象的准入指标,是保证研究 质量的最重要和最基本的条件,在研究设计 和发表的论著中务必详细交代。 但这种选入排除标准应是实事求是的而不 是过于苛求。
“前瞻性‛研究,无前瞻性的设计
几年前做了几万人的糖尿病普查 , 发现了 400 例糖尿病和500 例糖耐量低减,几年后的今天忽然想起这些病例很可能出一篇 文章,于是又去调查了一番,找到了200例糖尿病和300例糖耐 量低减。
写出 1.糖尿病人冠心病危险因素分析 2.高危人群糖尿病的危险因素.
这种研究是残缺不全的随访 ,并不是前瞻性研究 ,缺点是难 以弥补的。 高达 50% 的失访率会造成严重的信息偏差 ( information Bias ) : 若是有问题的人’召之即来’ , 则发病率会被高估 ; 若严重者已去医院看病不来参加,来的只有轻的病人,则会低 估疾病的发病率。
例1, 看生长激素水平与身高的关系: 对25—74岁者测GH与身高 结果发现GH与身高不相关 结论肯定错了 因为GH的最重要作用在于促生长 原因是人群选择失当 GH促生长表现在身高增长期,即儿童期 成人身高已不再增高。
研究肥胖与糖尿病的关系 不能仅选择超重和肥胖的人群(BMI 25-30) 因为(BMI 25-27) 与(BMI 27-30)的人群糖尿病的患病率 可能无明显差别, 但与BMI〈24人群差别会很显著
没达到‚狭窄‛切点, 只是时间尚短。 这并不能说明胰岛素与冠心病无关。
(二)、选择试验效果测试指标:
对测量的方法和指标的要求
① 敏感性要好:对于治疗出现的客观反应,要能敏感地发现 并能量度,其敏感性越高越好; ② ③
(二)、选择试验效果测试指标: 选择要求
关联性:指标与研究目的有本质的联系,应能确切反映处理 因素的作用。 生物学意义合理:冠脉造影,HbA1c看降糖药 物疗效。 灵敏性:指标能正确反映效应变化的最小数量或最小水平 。 特异性:对治疗反应的阳性结果要能准确地测量和确定,其 特异性越强越好;尽量选用客观指标作为主要观察指标。 精确性:包含准确度(效度)和精密度(信度)两个方面。 稳定性:变异程度 经济可行:在考虑敏感性和特异性的基础上,应从各种方法 比较中,选择经济及可行性良好的测试方法和指标。 指标的选择要少而精
终点事件过少
有些研究者为了某种原因,希望尽早发表自己 研究的结果,仅随访极短的时间 ( 半年或一年 ) ,仅 有几个或十几个终点事件(如死亡)就进行多因素 分析,寻找危险因素。
终点事件过少的这种分析看上去可能条条是道, 但其结果往往是不可靠的。应延长随访时间,增加 终点事件后再分析 Navigntor 研究设计出现 1000 个终点事体时才结题。
过度严格的选择会有轻型病人被排除, 使研究结果出现偏差。
例:冠心病与胰岛素的关系 仅用冠脉造影资料作为诊断标准 结果发现 冠脉造影(-)者:FINS 22 mm/ml 冠脉造影(+)者:FINS 23 mm/ml 结论是冠心病与胰岛素无关 问题出在什么地方?
问题出在‚诊断标准‛:
冠脉造影(-)的人为什么能接受这种不无危险的检查? 因为这些人已有许多危险因素!! 或有轻度狭窄但达不到‚狭窄的定义‛的切点
女性激素补充治疗的循证研究
(妇女健康倡议研究WHI) 19世纪70年代结论: 雌激素加孕激素能有效缓解更年期症状,治疗泌尿生殖道萎 缩,防止骨质疏松。但不会增加子宫内膜癌危险。
WHI(大规模,多中心,随机对照)结论:
雌激素孕激素联合治疗不宜用于绝经后妇女心血管疾病预防, 预防骨质疏松时应考虑乳腺及心血管病风险。弊多利少! 心脏事件 29%,卒中 41%,乳腺癌 26%, 结肠癌 37%,髋骨骨折 34%
从简单到复杂
最基本的分析形式为单个因素的不匹配不分 层资料组间比较的分析 这是病例对照研究推断性统计的基础。 可比较病例组与对照之间危险因素的分布情况, 分析其危险因素与患病之间的联系。
由于病例和对照只是总体的代表, 无法直接计 算真实的患病率,也就无法直接计算RR值,可以 估计相对危险度OR,用以来代替RR。
1.
1. 研究对象要有代表性
随机化抽样的缺点是研究对象地域较为分散, 每个单位仅有少量病例,这对于干预治疗的前瞻 性研究的病人管理极为不利,耗费更多人力,常 使研究无法进行。
而在人群较多的社区进行‚整群‛调查,会 在相对较小的地域找到较大样本,从而有利干预 治疗的管理。如果其人群结构接近全局的人群, 其统计的‚率‛也有重要参考价值。
三. 统计分析
在我国临床科研的统计学应用中,在统计方法 的选择上存在过分强调统计检验而忽略统计学估计 的倾向,存在统计方法越复杂越好的片面看法。 在发表的医学论文中,大多强调是否得到差别 有统计学意义,而较少对测定值进行 95% 可信区间 估计,提及样本量估计及抽样方法、样本代表性问 题的文章就更少了 在 80 年代初期,国外医学杂志针对类似的情况 曾进行广泛的讨论,提出应重视区间估计的意义而 不能将注意力集中在P值是否小于0.05上。
(2)、统计分析中变量的选择
变量的确定:
研究的目的是相看哪两个变量之间的关 系(不妨假设一因,一果)
例 ;高血压为因,冠心病为果
A.明确变量的性质
重点和首要的看变量是否为正态分布 分析中对变量进行正态分布检验 血胰岛素、血脂、生长激素、皮质醇、 尿微量白蛋白,骨密度等都常为非正态分 布。 非正态分布的变量是不能以原始资料进 行参数统计分析,此时不进行正态化处理, 得出结论会面目全非。
(一). 研究对象的选择
要想证实研究者的思想,确定入选和 排除标准,选择合理的研究对象是关键 的一环。
1.
1. 研究对象要有代表性
做疾病患病率的调查,随机化的原则可 保证研究样本是总体人群的‚缩影‛,从而 避免结果失真。 从某一局部地区‚整体人体‛调查出的 ‚率‛如推广到普遍认群,应说明该局部的 ‚整体‛人群与全局的人群结构相似。
选题----同型半胱氨酸是否是冠心病新的危险因素?
临床科研选题的原则
首先是研究的问题要涉及我国的常见病、多发 病、危害人民健康较严重的疾病。 第二个原则是所选的课题要有创造性和先进性, 要选择前人没有解决或没有完全解决的问题。研 究的结果应该是前人不明了或不完全明了的。
开拓性(独创性)研究最有价值。 发展性研究,争鸣性研究也有一定的价值 没有探索性,缺乏创造性,只是重复前人做过 的工作,不能算作好的科研。