统计概念.简答最终小范围一、集中趋势离散趋势的描述统计(概念、特点及应用条件?)☆☆☆1、集中趋势:反映一组数据的平均水平的指标。
(1)算术均数:应用条件:①正态分布的数据;②对称分布的数据。
(2)几何均数:适用条件:对于变量值呈倍数关系或呈对数正态分布。
(3)中位数:应用条件:①偏态分布②分布不明③有极端值④有开口的资料。
特点:不受极端值影响。
(4)百分位数:应用条件:①描述一组资料在某百分位置上的水平;②用于确定正常值范围;③计算四分位数间距。
(5)众数:一组观察值中出现次数最多的那个数值,可以没有也可以不止一个。
2、离散趋势:反映一组数据离散或分散的水平的指标。
(1)极差:全距=最大值-最小值。
①优点:计算简单方便,应用广范,容易理解。
②缺点:只反映两端数据最大最小值的差别,易受极端值的影响,不能反映组内其他变量离散情况。
(2)四分位数间距:Q=P75-P25。
①优点:不受极端值影响,比极差R稳定。
②缺点:计算繁琐、不易理解、只反映中间50%的数据的两端的差值(3)方差:特点:①充分反映了每一个数据与平均数的差别;②S2指标很稳定;③S2应用广泛;④S2计算比较麻烦;⑤S2单位是原单位的平方,在实际应用时不太方便。
(4)标准差:标准差是方差的开平方。
意义与方差相同。
特点:标准差的单位与原数据的单位相同。
(5)变异系数:应用条件:①用于比较不同单位数据的离散度。
②用于比较均数相差很大时的离散度。
特点:①无量纲的指标;②反映指标的稳定性;③一般CV不大于20~25%。
二、分析医学科研资料的基本思想及方法☆☆☆基本思路:根据研究目的及科研资料的性质和特点,选择正确的分析及检验方法,处理医学资料。
具体分析方法及步骤:(一)先将医学资料分类,根据资料类型选择相应的分析及检验方法;(二)具体步骤:1.计量资料:(1)data为正态分布,方差齐性;①t检验法(n<100):单样本t 检验;两样本t检验;配对样本t检验。
②μ检验法:单样本μ检验;两样本μ检验(n>100)。
③F 检验法:用于多样本均数比较。
包括:单因素方差分析;双因素方差分析;拉丁方设计方差分析;析因设计方差分析;交叉设计方差分析;正交设计方差分析。
④协方差分析:用于具有协变量的资料进行方差分析。
⑤直线相关与回归分析:主要用于2个变量的分析(x与y)。
⑥t′检验:也称为校正t 检验:数据为正态分布,但方差不齐。
(2)数据为非正态分布或方差不齐:主要用非参数检验。
①Wilcoxon符号秩检验:用于配对计量data。
②Wilcoxon秩和检验:用于两样本比较。
③Kruskal-wallis检验:也称为H 检验。
用于单因素多样本比较。
④Friedman检验:也称为M检验。
用于双因素多样本比较。
⑤秩相关(也称为等级相关):用于非正态数据,进行相关分析。
2.分类变量(资料):(1)二项分布及Poisson分布:用于处理二项分类资料及稀有事件模型资料。
(2)齐性的x2检验:①四格表x2 检验:两个率(构成比)的检验;②配对x2检验:用于配对计数data的检验;③行×列表x2 检验:多个率(构成比)的检验。
(3)独立性的x2 检验:分析2个变量间有无关联性相关性分析。
(4)秩检验(有序分类data 或等级data):①Wilcoxon两样本法:用于两样本等级data 检验。
②Kruskal-wallis检验:用于多个样本等级data检验。
t(5)Ridit分析:专门用于两样本或多样本等级data的比较。
(6)Kappa分析:用于临床诊断的一致性检验,可以是四格表或行×列表。
3.圆形分布数据:用圆形分布法分析和处理各种符合图形分布的数据。
4.其他各种分析方法:(1)随访data的生存分析:主要有kaplan-Meier法及寿命表法。
(2)多因素分析:①多元线性回归;②多元线性相关;③logistic回归;④Cox比例风险回归;⑤判别分析;⑥聚类分析;⑦主成份分析;⑧因子分析;⑨其他分析方法等。
三、统计软件的特点☆☆☆1、SAS:①世界著名的一流统计软件;②适合于专业统计人员使用;③功能极为强大、全面;④SAS占用空间大;⑤运算速度极快;⑥可以读入多种格式数据;⑦编程方式极为灵活但对话框方式的界面不太友好。
2、SPSS:①适合于中级、初级科研人员使用;②适合于专业及非专业统计人员使用;③界面友好;④占用空间比SAS小;⑤统计方法:是公认的、经典的统计方法;⑥SPSS也可以编程,但不如SAS功能强大;⑦SPSS也是世界著名统计软件。
3、PEMS:①在国内医学界及卫生统计界是权威性统计软件;②全中文界面,界面友好,使用方便;③内容包含有常用的统计分析方法,包括:基本统计方法,高级统计方法;④既可以处理原始数据进行统计分析,也可以分析经过整理的数据进行统计分析;⑤非常适合于专业及非专业统计人员使用,也适合临床医生使用。
4、stata:①非常小巧,约20-30M;②国际常用的统计软件;③功能强大,全面;④主要依靠编程→进行统计分析。
极具灵活性。
四、调查研究(普查、抽样调查、典型调查的特点☆☆☆)1、普查特点:☆☆☆①理论上只有普查才能取得总体参数,没有抽样误差,但往往非抽样误差较大。
②普查一般都是用于了解总体某一特定“时点”的情况。
③病程较短的疾病,不适合作时点普查。
2、抽样调查特点:☆☆☆①节省人力、财力和时间,可获得较为深入细致和准确的资料。
②许多医学问题只能作抽样调查。
③可用于检查普查的质量。
④实际工作中应用最多。
3、典型调查特点:☆☆☆①典型常是同类事物特征的集中表现,抓住典型,有利于对事物特征作深入的了解。
②典型调查可与普查结合,分别从广度和深度说明问题。
③典型调查不遵循随机抽样的原则,不能用于估计总体参数,但在一定条件下,根据专业知识,选定一般典型可对总体特征作经验推论。
【附】调查研究概念:指是研究过程中没有任何干预措施的条件下,客观地观察和记录研究对象的现状及其相关特征。
调查研究特点:①研究的对象及其相关因素是客观存在的;②不能用随机化分组来平衡混杂因素对调查结果的影响。
调查研究类型:1)普查:又称为全面调查,就是将组成总体的所有观察单位全部加以调查。
2)抽样调查:指总体中随机抽取一定数量的观察单位组成样本,然后用样本信息推断总体特征。
3)典型调查:亦称案例调查,即在对事物作全面分析的基础上,有目的地选定典型的人,典型的单位进行调查。
五、析因设计与正交设计(特点,符号的意义☆☆☆)1、析因设计概念:是一种多因素的交叉分组设计。
它不仅可检验每个因素各水平间的差异,而且可检验各因素间的交互作用。
(1)析因设计特点:☆☆☆①可分析多个因素多个水平的试验效应,可以分析各因素的独立作用及其各级交互作用;②节省样本含量,试验效率高;③设计时较为复杂,计算较为繁琐。
(2)析因实验的意义:☆☆☆最简单的析因设计☆2x2,意义:试验中有2个因素,每个因素各有2个水平。
☆2x2x2意义:试验中3个因素,每个因素各有2个水平。
☆2x2x3x2析因实验的意义:试验中有4个因素,第1、2、4个因素有2个水平;第3个因素有3个水平。
(3)交互作用类型模板:①独立作用:A、B、C、D,是四个因素各自的单独作用。
②一级交互作用:A×B,A×C,A×D,B×C,B×D,C×D,是任意两个因素的共同作用。
③二级交互作用:A×B×C,A×B×D,A×C×D,B×C×D,是任意三个因素的共同作用。
④三级交互作用:A×B×C×D,是四个因素的共同作用。
☆2x2x3x2类型实例:①独立作用:2、2、3、2,是四个因素各自的单独作用。
②一级交互作用:2×2,2×3,2×2,2×3,2×2,3×2,是任意两个因素的共同作用。
③二级交互作用:2×2×3,2×2×2,2×3×2,2×3×2,是任意三个因素的共同作用。
④三级交互作用:2×2×3×2,是四个因素的共同作用。
2、正交试验设计概念:是一种高效的多因素试验的设计方法。
它利用一套规格化的正交表,合理地安排实验,通过对实验结果进行分析,获得有用的信息。
(1)正交试验设计特点:☆☆☆①可分析三个及三个以上因素的作用及其交互作用。
②用最少的试验次数获得更多的信息。
③可用方差分析处理正交设计的测量数据,但计算十分繁琐。
(2)正交试验设计意义:①L N(m K)的意义:☆☆☆L N(m K)表示正交表有N行K列,每一列由1,2,….,m个整数组成。
L N(m K)安排试验,N表示试验次数,k 表示最多可安排的因素个数,m表示各因素的水平数。
②L8(27) 意义:表示要求做8次试验,允许最多安排7个“2”水平的处理因素。
③L16(42X29) 意义:表示要求做16次试验,允许最多安排2个“4”水平处理因素,9个“2”水平处理因素。
六、概念:圆形分布、生存分析、截尾值、重复测量。
☆☆☆1、圆形分布:凡是具有周期性和循环性的资料为圆形资料,是用圆形分布法分析和处理各种符合图形分布的数据。
2、生存分析:是将事件发生的结果和随访时间两个因素结合在一起进行分析的一种统计分析方法,它能充分利用所得到的研究信息,更加准确地评价和比较随访资料。
3、截尾值:也称终检值,删失数据,不完全数据,指在随访过程中,由于某种原因未能观察到病人的明确结果(终止事件),所以不知道该病人的确切生存t,它提供的生存t的信息是不完整的。
4、重复测量:最常见的情况是前后测量设计,当重复测量次数m≥3时,称重复测量设计或重复测量数据,它不能同期观察实验结果,本质上比较的是前后差别,假定测量时间对观测结果没有影响。
七、实验设计的基本要素和基本原则:(1)实验设计基本要素:①受试对象:研究人员所要观察的客体,即处理因素作用的对象;②处理因素:-研究人员施加于受试对象并能产生一定实验效应的因素;③实验效应:-处理因素施加于受试对象并经过一段时间,受试对象产生的各种反应及表现。
(2)实验设计基本原则:①随机化的原则:-指总体中每个个体都有均等的机会被抽取,或被分配到实验组及对照组中去;②对照化的原则:-是指在实验研究中使受试对象的处理因素和非处理因素的实验效应的差异有一个科学的对比;③重复的原则:-重复有2层含义:样本含量的大小和实验重复次数的多少;④均衡的原则:-指对照组除处理因素与实验组不同外,其他各种条件及因素基本一致。