当前位置:文档之家› 医学统计学研究生期末考试版

医学统计学研究生期末考试版

一、名词解释(考10对)1.总体;样本总体:根据研究目的确定的、同质的全部观察单位某一指标(或某些因素及结果)的测量值总体。

根据总体集合所包括元素是否有限,分为有限与无限总体。

总体具有特定的分布特征及参数;样本:以某方式按预先规定的概率从总体中随机抽取的、具有足够数量的、能够代表总体分布特征的一部分观察单位某指标数据的集合。

根据研究目的从总体中抽取部分有代表性的样本,用样本统计量推断总体参数。

2.标准差;标准误标准差:是描述单个测量值对其均数的离散程度。

标准差越大,数据的离散程度就越大,均数的代表性越差;标准差越小,均数的代表性越好。

标准误:样本统计量的标准差称为标准误,它反映样本统计量的抽样误差的大小,也反映样本统计量对总体参数的离散程度。

标准误大,表示样本统计量对总体参数的代表性差;标3、s x 96.1±;x v s t x ⋅±)(2/αs x 96.1±:表示从正态总体中抽样,样本含量较大时,观测值双侧95%的波动范围 x v s t x ⋅±)(2/α:从正态总体中抽样,样本含量较大(小)时,按照预先给定的概率a 确定的总体均值的(1—a )的可信区间。

4.计量资料(数值变量资料);计数资料(分类变量资料)计量资料:通过度量的方法,测量每个观察单位的某项指标的量的大小而得到的一系列数据资料,其特点是多有度量单位或多为连续性资料。

计数资料:指将全体观察单位按某种属性分组,然后再分别清点各组观察单位的个数而得到的数据资料,其特点是没有度量单位或多为非连续性资料5.点估计;区间估计点估计:直接利用样本统计量的一个数值来估计总体参数,比如基于一份随机样本,用x 估计u,用p估计π,用S估计σ。

点估计方法简单,但未考虑抽样误差,故难以反映估计值对其真值的代表性。

区间估计:将样本统计量和标准误结合起来,按预先给定的概率(1—a)所确定的一个包含未知总体参数的范围,该范围为总体参数的置信区间(CI)。

预先给定的概率(1—a)称为可信度或置信度,常取95%或99%。

6.回顾性研究;前瞻性研究回顾性研究:即病例—对照研究,是由果到因,即先选定病例组和对照组,然后分别回顾两组过去的暴露情况,比较其差异,探索与发病相关的可能因素。

回顾性研究的优点是对于患病率非常低的研究人群可获得较高的效果,研究周期较短和可以探索多个因素与患病的关联;其缺点是不能估计患病率和死亡率,容易产生回忆性偏倚和选择性偏倚。

前瞻性研究:即队列研究,是由因寻果,是将选定的人群按暴露状况分成暴露组和对照组,暴露组接触某个因素而对照组不接触某个因素,其他所有条件两组基本相同。

经过一定时间随访,比较暴露组和对照组在随访期间的发病率,如果两组发病率不同,则归因于该暴露因素。

前瞻性研究的优点是可以估计发病率,暴露测量可以做到无偏倚,结论比较可靠。

其缺点是研究效率比较低,研究周期比较长导致在研究期间可能出现失访及各种混杂因素影响。

7、完全随机设计;随机区组设计完全随机设计:又称为单因素设计或成组设计,是将同质的研究对象随机地分配到各处理组中进行实验观察,或从不同总体中随机抽样进行对比研究。

随机区组设计:又称配伍组设计,是在实验设计中用一个非研究因素的变量进行分层,每个层的观察对象数相等,并对每个层进行随机分组。

两种实验设计方案均为单因素实验设计。

区别是:①两者观察对象随机分配方式不同;②统计分析方法不同;③误差内涵及大小不同;④检验效能不同。

8.独立性数据与重复性数据独立性:对一群观察指标独立测定一次,形成一个群体数据,观察值间互相独立,不相互影响。

重复性:一个观察对象,同一或不同时间测定产生的数据。

9.α值;P值α值:检验水准(显著性水准),即在假设检验中预先规定的判断小概率事件的概率尺度,通常为0.01或0.05,代表在原假设成立的前提下,拒接原假设所犯I类错误的概率。

P值:从已知总体中(或假设总体中)抽得统计量达到当前统计量这么大及比这绝对值还大的总概率,若以当前统计量为拒绝域临界点,在规定α前提下,实际欲拒绝H可能犯I类错误的概率。

P2710.观察性研究;实验性研究观察性研究:是指对研究对象不加任何干预措施,在完全“自然状态”下观察、记录各研究对象的特征,描述现象的本质,比较不同环境条件下疾病的发生、发展。

观察性研究可以在相应的人群中随机抽样,但不能随机分组,只能按不同的暴露水平分组。

与实验性研究相比,调查中涉及的混杂因素较多,所需样本量较大,资料必须做多因素分析。

实验性研究:是指对研究对象人为施加干预的研究。

在干预前,研究对象来自同一总体,研究者通过随机分组,对不同处理组的研究对象施加不同的干预,从而比较不同干预措施结果间的差异。

两者的区别为:①处理因素能否由研究者主动设置;②对象能否随机分组;③样本大小不同;④混杂因素多少不同;⑤统计方法应用不同;⑥严谨性,重、再现性不同。

11、r;br:直线相关系数,描述样本资料的两变量之间线性相关性并判断其密切程度。

相关系数r 没有单位,在-1~+1范围内变动,相关系数的绝对值越接近1,两个变量的线性相关程度越强;相关系数的绝对值越接近0,两个变量的线性相关程度越弱。

相关系数若为正,说明一变量随另一变量增减而增减,方向相同,为正相关;若为负,表示一变量增加、另一变量减少,即方向相反,为负相关;若为零,两变量间没有任何伴随变化趋势,为不相关或零相关。

b:直线回归系数,为回归直线的斜率,也即总体回归系数β的估计值。

其统计学意义为X 每改变一个单位,Y 平均改变b 个单位。

两者相同点为:①均为数量协同变化研究;②同一资料,两者方向一致;③同一资料,两者假设检验一致;④均有一定的线性范围;⑤2r b b yx xy =⋅两者不同点为:①含义不同:r 表示服从双变量正态分布的两个变量间的数量协同变化的密切程度,b 表示变量Y 随变量X 呈现出的线性依存关系;②两者表达式不同;③两者应用范围不同:直线相关应用于流行病学、探索性实验研究;直线回归应用于实验室工作曲线研究。

12、灵敏度;特异度灵敏度:表示实际患病按检测结果正确判为有病的概率。

灵敏度反映诊断方法正确诊断某病的能力,灵敏度越高,诊断为假阴性的概率越小,即漏诊的可能性越小。

特异度:表示实际未患病按检测结果正确判为没病的概率。

特异度反映诊断方法正确排除某病的能力,其值越大,诊断为假阳性的概率越小,即误诊的可能性越小。

13、精密度;准确度精密度:表示用同种测试方法重复测定同一样品,其测定结果的一致性。

可用标准差或变异系数描述。

准确度:表示用某种测试方法测定某一样品,其测定值对真值的偏离程度,一般可用回收率表示。

14、关联性分析;趋势性分析关联性分析:是研究具有相互作用(对称关系)或单向作用(不对称关系)的两变量取值或取值频数是否存在影响与联系的统计分析方法。

关联性分析较趋势性分析内涵更宽泛,适用资料广,但量化含义相对粗犷,适合于社会学调查资料分析,对于定类变量一般不计方向。

趋势性分析:针对一个变量随同另一个变量的数量变化有规律地发生线性或非线性数量协变关系,研究其协变关系规律的统计分析方法称为“趋势性分析”。

两者的比较(ppt )15.筛查试验的阳性预测值与阴性预测值筛检的阳性预报率:表示某种诊断方法预测阳性结果的正确率,即诊断结果为阳性者实际患病的概率。

筛检的阴性预报率:表示某种诊断方法诊断结果为阴性者实际未患病的概率。

二、填空题(5个,20空)及选择题(单选,选正确或最优)1.s x ±; M ;%)25(%)75(X X Q -=s x ±:表示一个算术均数为x ,标准差为s 的样本。

M:中位数,指的是在按大小顺序排列的一个变量的所有n 个观察值中,位于正中间的那个数值。

当计量资料中有离群值,或数据分布不对称(包括左偏和右偏)时,或数据的上限或下限不明确时,均宜使用中位数来描述数据的集中趋势。

%)25(%)75(X X Q -=:四分位数间距,为描述计量资料离散趋势的指标之一,对于计量单位相同的变量,四分位数间距越大,观察值的离散程度越大。

2.医学统计学的“六性分析”为:①估计性;②聚积性;③差异组间对比性——统计对比,临床效果对比;④关联性;⑤趋势性——方向性、单调性、无量纲性、变量匹配性;⑥协调性。

3.计量资料七种研究设计方案:①单因单结果变量:完全随机设计;随机区组设计;重复测量设计。

②多因单结果变量:交叉设计;析因设计;正交设计。

③单因多结果变量:多元2T 设计。

4.临床论文从理论上要包括四种分析(临床研究对比分析):①均衡性检验(影响结果的对比组结构性要一致);②纳入数据集汇总与描述;③效果分析:包括统计差异性检验和临床差异性检验(优效性检验、等效性检验、非劣效性检验);④安全性评价(医学伦理学要求)。

5.诊断实验研究设计要点:①要具备“金标准”,即当前国内外临床专业医师公认的诊断某种疾病的最可靠方法;②要有随机对照试验和真实两组人群(真病人组、非病人组、大样本);③执行试验者盲法检测(不知对象或样本的真实组别);④同期检测(防治病情变化和待测组分变化);⑤最好了解人群患病率,以便对比两种患病率(结构、人群)和计算预报率。

6.诊断实验准确度的三类评价指标:(1)基本指标:①敏感度;②特异度;(2)综合指标:①准确度;②尤登(金)指数;③阳性似然比;④阴性似然比;(3)其他指标:①结构预报率,包括阳性预报率及阴性预报率;②人群预报率,包括人群阳性预报率及人群阴性预报率。

7.实验设计的基本要素:①处理因素;②实验对象;③实验效应。

8.实验设计的四个基本原则:①随机化原则;②设置均衡对照原则;③足够样本含量;④盲法原则。

9.临床医学参考值范围统计方法上注意点:①抽取足够例数的同质“正常人”样本;②确定具有实际意义的统一测量标准;③根据指标的性质确定是否要分组;④根据指标含义确定单、双侧范围;⑤选择适当的百分范围,一般常用95%或99%医学参考值范围;⑥根据资料的分布类型选择相应的计算制定医学参考值范围的方法。

10.等级资料的对比分析:等级资料比较水平差异不能用卡方检验,只能用等级秩和检验。

11.结果指标多于2个的对比性分析:单因多结果变量用2T 检验。

12.单向有序列联表:原因变量为等级变量资料,结果变量为二值变量资料可做趋势性卡方分析。

13.双向有序列联表:双向等级列联表可做相关分析。

14.常用随机抽样方法有:(1)基本抽样方法——①单纯随机抽样;②系统随机抽样;③分层随机抽样;④整群随机抽样。

(2)结合型抽样方法——①分层整群随机抽样;②多阶段随机抽样。

15.变量类型:(1)按性质分:①数值变量;②等级变量;③分类变量。

相关主题