当前位置:文档之家› 重庆医科大学医学统计学1

重庆医科大学医学统计学1

一. 名词解释1. 调查研究与实验研究调查研究是指研究者较被动地进行观察,希望尽可能减少或控制非实验因素干扰的研究。

调查研究可以在相应的人群中随机抽样,但不能随机分组,只能按不同的暴露水平分组,与实验研究相比,调查中涉及的混杂因素较多,所需样本量较大,资料必须做多因素分析。

实验研究是指研究者主动安排实验因素,控制实验条件,排除非实验因素干扰的研究。

也是指对研究对象人为施加干预的研究。

在干预前,研究对象来自同一总体,研究者通过随机分组,对不同处理组的研究对象施加不同的干预,从而比较不同干预措施结果间的差异。

调查研究常为实验研究提供线索,实验研究成果又须回到现场实践中去验证。

两者的区别为:1.处理因素能否由研究者主动设置。

2.对象能否随机分组。

3.样本大小不同。

4.混杂因素多少不同。

5.统计方法应用不同。

6.严谨性,重现性不同。

2. 分层抽样,整群抽样,分层整群抽样分层抽样:是先将总体全部个体按某种特征分成若干层,再从每一层内随机抽取一定数量的个体合起来组成样本。

整群抽样:是先将总体分成若干群体,形成一个抽样框,从中随机抽取几个群体组成样本,对抽中群体的全部个体进行调查。

分层整群抽样:先将总体全部个体按某种特征分为若干层,在所有层内实施整群随机抽样的方法。

分层抽样的优点:抽样误差小;对不同层可采用不同抽样方法;可对不同层独立进行分析。

缺点:需要掌握对抽样对象的分层特征;抽样工作量大。

使用范围:主要用于控制重要混杂因素影响。

整群抽样的优点:便于组织;节省经费;容易控制调查质量。

缺点:抽样误差较大;群间变异较大;抽样误差较大。

使用范围:适用抽样总体很大的情况。

3. 数值变量资料与分类变量资料数值变量资料(计量资料):是指通过度量衡的方法,测量每一个观察单位的某项指标的量的大小而得到的一系列数据资料,其特点是多有度量单位和多为连续性资料。

分类变量资料(计数变量):指将全体观察单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数而得到的数据资料,其特点是没有度量衡单位和多为间断性资料。

4. 点估计值与95%可信区间点估计值:就是直接用样本统计量的一个数值来估计总体参数,例,基于一份随机样本,用均数x 作为总体均数u 的一个估计,用样本的标准S 作为总体标准差o 的一个估计,即直接用样本统计量X+_S 作为总体参数u+-0的估计值。

点估计方法简单,但未考虑抽样误差,故难以反映估计值对其真值的代表性。

区间估计:将样本统计量和标准误结合起来,按预先给定的概率(1—a )所确定的一个包含未知总体参数的范围,该范围为总体参数的置信区间(CI )。

预先给定的概率(1—a )称为可信度或置信度,常取95%或99%。

95%可信区间:按预先给定的概率0.95用一个区间来估计总体均数,这个区间称为可信度0.95的可信区间(CI )或置信区间,预先给定的0.95称为可信度或置信度。

5. X+-1.96S 与X+-Ta/2 S xs x 96.1±:表示从正态总体中抽样,样本含量较大时,观测值双侧95%的波动范围,常用来制定参考范围,判断某人的某一指标是否正常。

x v s t x ⋅±)(2/α:从正态总体中抽样,样本含量较大(小)时,按照预先给定的概率a 确定的总体均值的(1—a )的可信区间,表示该区间有(1—a )的可能性包括总体均数。

6. OR 与 RRRR :相对危险度,表示暴露于某种危险因素观察对象的发病(死亡)危险度(P1)与无暴露因素组(或低暴露)观察对象发病危险度(P0)的比值。

当RR=1时,表示该因素对疾病的发病无影响; 当RR>1时,表示该因素为危险因素,它使发病危险度增大; 当RR<1时,表示该因素为保护因素,它使发病危险度减小。

优势:指某病患者组(或非患者组)中某种危险因素存在的比例P (e )与不存在的比例(1-P(e))的比值称为优势。

OR :优势比,病例组有暴露因素的优势与对照组有暴露因素的优势比值。

OR>1表示有暴露因素的人患某病的机会或优势与对照组相比增加,为危险因子。

OR<1表示有暴露因素的人患疾病的机会(或优势)减少,为保护因子。

OR=1意味无论暴露出线与否,与疾病关系不大。

OR 为比值比,指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。

是反映疾病与暴露之间关联强度的指标。

RR 为相对危险度,是反映暴露与发病(死亡)关联强度的最有用的指标。

表明暴露组发病或死亡的危险是非暴露组的多少倍。

RR 值越大,表明暴露的效应越大,暴露与结局关联的强度越大。

两者都是指暴露者的疾病危险性为非暴露者疾病危险性的多少倍,但是RR 多用于队列研究,OR 用于病例对照研究。

7. r 与 br :描述样本资料的两个变量之间线性相关性的相关系数称样本线性相关系数,用符号r 表示。

在实际工作中,总体线性相关系数是未知的,通常用样本线性相关系数r 进行估计,其取值范围为-1到1,r>0表示正相关;r<0表示负相关,r=0表示不相关。

相关系数的绝对值越接近1,来那个个变量 的线性相关程度越强;相关系数越接近0,两个变量的线性关系越弱,r=1时称完全正相关,r=-1称完全负相关。

其资料条件为双变量正态分布或Y 为正态分布。

b :样本直线回归系数,当X 变换一个单位时Y 的平均改变的估计值,b>0,Y 随X 的增大而增大,b<0,Y 随X 的减小而减小。

b=0,X 与Y 无直接关系。

其资料条件为双变量正态分布。

两者相同点:1.均为数量协同变化研究2.同一资料,两者方向一致3,同一资料,两者假设检验一致4均有一定的线性范围5bxy 。

Byx=r2 两者不同点:1含义不同2两者表达式不同3两者应用范围不同:直线相关应用于流行病学,探索性实验研究,直线回归应用于实验室工作曲线研究。

b r (1)概念 样本直线回归系数 样本直线相关系数(2)计算公式 ∑∑∑∑∑--=n X X n Y X XY b /)(/))((22 r=∑∑----22)()())((y y x x y y x x(3)统计意思 当X 变化一个单位时Y 的平均改变的估计值。

b>0,Y 随X 的增大而增大;b<0,Y 随X 的增大而减小。

具有直线关系的两变量间相关的密切程度与相关方向。

r>0为正相关,r<0为负相关。

(4)资料条件 双变量正态分布,或Y 为正态分布。

双变量正态分布8. 1-a 与1- b1-a :在假设检验中,拒绝Ho ,犯I 类错误的概率,1-a 越大,所需样本量越小,一般要求1-a 在0.95以上。

1-b :在假设检验中,不拒绝Ho ,犯II 类错误的概率,1-b 越大,所需样本量越大一般要求1-b 在0.8以上,b 一般只取单侧。

假设检验中,无论是接受还是拒绝原假设均有可能犯错。

如拒绝了一个实际成立的原假设,所犯错误称为Ⅰ类错误,其概率记为α(1分);如接受了一个实际不成立的原假设,所犯错误称为Ⅱ类错误,其概率记为β(1分);当样本含量确定时,α越大,则β越小,反之,α越小,则β越大(1分),如拟同时降低α与β,则需增大样本含量(1分)。

9. 完全随机设计与随机区组设计完全随机设计:是指将同质的受试对象随机分到各处理组进行实验观察或从不同总体中随机抽样进行对比的研究。

优点:设计及统计分析简单。

缺点:试验效率不高,只能分析单因素。

随机区组设计:讲受试对象按某些特征或条件配成对子,然后分别把每对中的两个受试对象随机分配到实验组和对照组,再给予每对中的个体以不同的处理,连续试验若干对,观察对子间的差别无意义。

优点:把条件一致的研究对象编入同一区组并分配于各研究组,使各研究组之间的可比性更强,能改善组间均衡性,即缩小了误差,又可分析处理组间和配伍组间两因素的影响,试验效率较高。

缺点:分组较繁,临床几乎不可能做的。

完全随机设计将全部实验对象完全随机分配到处理因素各水平,通过比较各组均数来判定处理结果(2分);随机区组设计指全部实验对象按区组与处理分配,即先根据对象的自然属性或对实验有影响的非处理因素分为几个区组,再于每一组中随机抽取分配到各处理水平的分配方式(2分)。

10. LR(+)与LR (-)LR(+):阳性释然比,是筛查结果的真阳性率与假阳性率之比。

表示正确判断阳性的可能性是错误判断阳性可能性的倍数。

其比值越大,试验结果阴性时为真阳性的可能性越大。

LR(-):阴性释然比,是筛查结果的假阴性率与真阴性率之比。

表示错误判断阴性的可能性是正确判断阴性可能性的倍数。

其比值越小,试验结果阴性时为真阴性的可能性越大。

筛检的阳性预报率:表示某种诊断方法预测阳性结果的正确率,即诊断结果为阳性者实际患病的概率。

筛检的阴性预报率:表示某种诊断方法诊断结果为阴性者实际未患病的概率。

11. 定量测量的一致性 与 定性测量一致性定量测量的一致性:定性测量的一致性:、12. 信度和效度信度:即可靠性,是指采用同一方法对同一对象进行调查时,问卷调查结果的稳定性和一致性,即测量工具能否稳定地测量所测得事务或变量。

信度指标多以相关系数表示。

效度:即有效性,它是指测量工具或手段能够测量出所需测量的事物的程度。

效度分为三种类型:内容效度,准则效度和结构效度。

13.定量测量的精密度与准确度精密度:是指对同一个标本进行多次重复测定时,测量值与平均测定值的接近程度,属于随机误差,常用标准差或变异系数表示。

此值越小,说明测定方法重现性越好。

准确度:是指测量值与真值的接近程度,用于说明测定方法有无系统误差。

一般偏离100%较大时,则测定方法存在系统误差。

精密度与准确度均为评价检测方法可信赖程度的指标,其中以准确度为首要指标,当测定方法存在系统误差时,即使精密度高,也不能采用此方法;当测量方法的精密度差时,其准确度也不会高。

14.独立测定与重复测定独立测定:对一群观察指标独立测定一次,形成一个群体数据,观察值间相互独立,不互相影响。

重复测定:是指对同一研究对象的某一观察指标在不同的场合进行的多次测量。

各测量数据之间有关联。

15.关联分析与趋势分析关联分析:是研究有相互作用(对称关系)或单向作用(不对称关系)的两变量取值或取值频数是否存在影响与联系的统计分析方法。

较趋势分析内涵广,适用资料广,但量化含义相对粗狂。

适用于社会调查资料分析,对于定量变量一般不计方向。

特点:1变量搭配形式多2多为静态3统计量关联系数无量纲4关联或影响不分正负5统计量只表达关联程度6一般区分愿意变量和结果变量7原因变量不参与计算分析趋势分析:针对一个变量随另一个变量的数量变化有规律地发生线性,非线性数量协边关系,研究其协变关系规律的统计分析方法,存在自变量和应变量。

相关主题