当前位置:文档之家› 医学统计学期末重点总结

医学统计学期末重点总结

误差:观测值与真实值、样本计量与总体参数之间的差别。

相对数:两个有关的绝对数之比,也可以是两个有关联统计指标之比。

相对比:相对比是A、B两个有关联指标值之比,用以描述两者的对比水平,说明A是B 的若干倍或百分之几。

统计描述:描述及总结一组数据的重要特征,目的是使实验或观察得到的数据表达清楚并便于分析。

统计推断:指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。

同质:指根据研究目的所确定的观察单位其性质应大致相同。

变量:反映实验或观察对象生理、生化、解剖等特征的指标,变量的观测值称为数据。

定量数据:也称计量资料。

变量的观测值是定量的,其特点是能够用数值大小衡量其水平的高低,一般有计量单位。

根据变量的取值特征可分为连续型数据和离散型数据。

有序数据:也称半定量数据或等级资料。

变量的观测值是定性的,但各类别(属性)之间有程度或顺序上的差别。

总体:根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围内的个体变量值。

样本:从研究总体中抽取部分有代表性的观察单位,对变量进行观测得到的数据。

参数:描述总体特征的指标称为参数。

统计量:描述样本特征的指标称为统计量。

概率:描述某事件发生可能性大小的度量。

小概率事件:习惯上将P≤0.05的事件称为小概率事件。

平均数:是描述一组观察值集中位置或平均水平的统计指标,常用的有算术均数、几何均数和中位数。

率:率表示在一定空间或时间范围内某现象的发生数与可能发生的总数之比。

构成比:表示某事物内部各组成部分在整体中所占的比重,常以百分数表示,计算公式为区间估计:是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。

线性相关的概念:研究两个变量之间是否具有直线相关关系。

相关系数:是说明具有线性相关关系的两个数值变量间相关的密切程度与相关方向的统计量。

研究对象:根据研究目的而确定的观察总体,也可称为受试对象或实验对象。

处理因素:根据研究目而欲施研究对象的干预措施。

处理水平:处理因素在实验中所处的状态称为因素的水平(level),亦称处理水平。

对照:指在实验中应设立对照组,其目的是通过与对照组效应对比鉴别出实验组的效应大小。

随机化:是指每个受试对象有相同的概率或机会被分配到不同的处理组。

重复:是指在相同实验条件下重复进行多次观察。

统计学的基本内容:统计设计,数据整理,统计描述,统计判断
数据类型:定量数据,定性数据,有序数据
误差的类型:系统误差,随机测量误差,抽样误差
配对样本t检验配对设计:同源配对,异源配对,自身配对
方差分析的基本思想:将全部观测值的总变异按影响因素分解为相应的若干部分变异,在此基础上,计算假设检验的统计量F 值,实现对总体均数是否有差别的推断。

非参数检验的适用范围:①总体分布类型未知或非正态分布数据;②有序或半定量资料;③数据两端无确定的数值。

标准差与标准误的区别与联系:区别:标准差:意义,描述个体观察值变异程度的大小,标准差越小,均数对一组观察值的代表性越好。

应用,与X拔结合,用以描述个体观察值的
分布范围,常用于医学参考值范围估计。

与N的关系,N越大,S越趋于稳定
标准误Sx拔:描述样本均数变异程度及抽样误差的大小,标准误越小,用样本均数推断总体均数可靠性好。

与X拔结合,用以估计总体的均数可能出现的范围,以及对总体的均数作假设检验。

N越大,Sx拔越小。

联系:标准差与标准误都是描述便宜程度的指标。

Sx拔与S成正比,N一定时,S越大,Sx拔越大
1类错误与2类错误区别联系:区别:依依不通过,1类错误为拒绝了实际上成立的H0,也称弃真错误,第2类错误为不拒绝实际上不成立的H0,也称存伪错误。

概率不同,1类错误的概率为α,是根据研究目的设定的,2类错误概率为β是未知的,β能通过α间接估计大小。

联系:当样本含量一定时,α越大,β越小,α越小,β越大。

要同时减少1、2类错误,可增加样本含量
怎样正确选择用单侧检验和双侧检验:对于假设中的单侧检验和双侧检验的选择,要根据研究目的和专业知识而定。

若目的在于判断两总体均数,是否不等,或者有无差别,则应选择双侧检验,若从专业知识认为不会出现M<M0或M>M0,而检验目的是用以说明M>M0或M<M0时,则应选择单侧检验,在对专业知识不明确时,一般选择双侧检验单侧检验易获得p<α的结论,应慎重使用
线性回归与相关的关系:对同一资料做相关回归分析,相关系数r与回归系数b的正负符号相同,对同一资料做相关与回归分析,相关系数的t检验与回归系数的t检验相同,即t=tb,相关与回归可以相互解释,即r的平方=SS回归/SS总
计量资料的检验方法有哪些:t检验(样本均数总体均数的比较,两个样本的均数的比较,配对资料的t检验)μ检验:大样本均数与总体均数的比较,两个大样本均数的比较。

F检验:完全随机设计单因素方差分析,随机区组设计方差分析,拉丁方设计的f方差分析
描述计量资料离散趋势常用的指标有哪些,其适用条件:指标有:极差,四分位数,方差,标准差,变异系数。

适用条件:极差和四分位数适用于偏态分布资料用以描述其离散程度或变异度。

方差标准差适用于对称分布或正态分布资料用以描述其离散程度或变异度。

变异系数适用于度量衡单位不同,或均数相差比较悬殊的两组资料,比较其离散程度,或变异度描述计量资料集中趋势的指标有哪些,其适用条件:指标:算数平均数,几何均数,中位数。

适用条件:算数平均数适用于对称分布或正态分布资料,几何均数适用于等比分布或对数正态分布资料
卡方资料的假设检验方法(四格表资料卡方检验,行x列资料,配对资料
描述计量资料的统计描述有:频数分布表和频数直方图,集中趋势的描述(常用平均数,算数平均数,几何均数,中位数)离散趋势的描述(极差,四分为间距,方差,标准差,变异系数)
描述方差分析的应用范围:完全随机设计的两个或两个以上的均数比较的方差分析,随机区组设计的方差分析,拉丁方设计的方差分析,回归分析中直线回归方程的假设检验,多个因素的交互作用分析
简述检验假设步骤:建立假设和确定检验水准,选择检验方法和计算检验统计,确定p值和做出统计推断结论
均数的可信区间与参考值范围有何不同:可信区间:是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。

计算:正态分布:δ未知
应用:总体均数的区间估计,评估未知总体均数所在的范围;参考值范围:正常人的解剖,生理,生化某项指标波动的范围,95%参考值范围指同质总体包含95%个体值的估计范围,说明个体的波动范围。

计算:
判断观察值的某项指标与否,评价个体指标是否正常。

线性回归分析的应用:1. 线性回归方程可应用于以下三个方面:①分析两个变量之间是否存在线性依存关系;②利用回归方程由自变量X 对应变量Y 进行估计,必要时可以作区间估计;③利用回归方程进行统计控制,即利用回归方程进行逆运算,通过控制自变量X 取值来限定应变量Y在一定范围内波动。

2. 作回归分析时,如果两个有内在联系的变量之间存在因果关系,那么应该以原因变量为X ,以结果变量为Y;如果变量之间因果关系难以确定,则应以易于测定或变异较小者为X。

3. 在回归分析中,自变量X 既可以是随机变量,也可以是给定的量。

如果Y不服从正态分布,在进行回归分析前,应先进行变量的变换以使应变量符合回归分析的要求。

4. 使用回归方程估计Y 值时,尽量不要把估计的范围扩大到建立方程时的自变量的取值范围之外,由于超出样本取值范围,其线性关系是否成立难以判断,外推要慎重。

相关主题