当前位置:文档之家› 医学统计学_知识梳理

医学统计学_知识梳理

均数土标准差:表示集中位置、离散程度均数土标准误:表示平均水平、抽样误差大小P75 、标准差的主要作用是估计正常值的围实际应用中,估计观察值正常值围应该用标准差(s),表示为“Meant SD。

此写法综合表达一组观察值的集中和离散特征的变异情况,说明样本平均数对观察值的代表性。

s的大或小说明数据取值的分散或集中。

s与样本均数合用,主要是在大样本调查研究中,对正态或近似正态分布的总体正常值围进行估计。

如果不是为了正常值围估计,一般不用。

当数据与正态分布相差很大,或者虽为正态分布,但样本容量太小(小于30或100),也不宜用估计正常值围。

二、标准差还可用来计算变异系数(CV)当两组观察值单位不同,或两均数相差较大时,不能直接用标准差比较其变异程度的大小,须用变异系数系数来做比较。

:2.2标准误的正确使用一、标准误用来衡量抽样误差的大小和了解用样本平均数来推论总体平均数的可靠程度。

在抽样调查中,往往通过样本平均数来推论总体平均数,样本标准误适用于正态或近似正态分布的数据,是主要描述小样本试验中,样本容量相同的同质的多个样本平均均数间的变异程度的统计量。

即如果多次重复同一个试验,它们之间的变异程度用。

显然它越小,样本平均数变异越小,越稳定,用样本平均数估计总体均数越可靠。

因此,为说明它的稳定性、可靠性或通过几个对几组数据进行比较(这是科研论文中最常见的),应当用描述数据。

实际应用中应该写成平均数±标准误”或而英文表示为“Mean土SE的形式。

二、标准误还可以进行总体平均数的区间估计与点估计(置信区间)。

根据正态分布原理,与合用还可以给出正态总体平均数的可信区间估计即推论总体平均数的可靠区间,例如常用(其中t0.05 (n-1)为样本容量是n的t界值)表示总体均值的95%可信区间,意指总体平均数有95%的把握在所给围。

三、标准误还可用来进行平均数间的显著性检验,从而判断平均数间的差别是否是由抽样误差引起的。

例如:某当地小麦良种的千粒重=34克,现在从外地引入一新品种,通过多小区的田间试验得到千粒重的平均数=35.2克,问新引进品种千粒重与当地良种有无显著差异?新引进品种千粒重与当地良种有无显著差异实质是判断与的差别是否是有田间试验是抽样误差引起,所以要进行显著性检验,这里用t测验进行检验,而,由于,故,所以认为新引进品种千粒重与当地良种千粒重的不同是由于田间试验是抽样误差引起,因此他们之间无显著差异。

所以在进行平均数间的显著性检验是必须用到。

总之,标准差和标准误最常用的统计量,二者都是衡量样本变量(观察值)随机性的指标,只是从不同角度来反映误差,二者在统计推断和误差分析中都有重要的应用。

如果没有标准差,人们就无法看岀一组观察值间变异程度有多大,这些数字到底有无代表性,如果没有标准误又很难看岀我们的样本平均数是否可以代表总体平均数。

所以二者都非常重要。

定量资料的统计描述:频数分布表:全距,R=最大值-最小值;组距=全距/组数,(组数8-9人一组)频数分布图:直方图集中位置的描述:平均数 31.算数均数:卩总体均数,\X _样本均数。

适用定量资料,对称分布, 正态或近似正态2. 几何均数:G ,适用变量值呈 倍数关系,偏态尤其对数变换后正态或近似正态3. 中 位数:M ,各种分布(不对称,两端无确切值,分布不明确 ),正态等于算数均数,对数正态等于几何均数。

离散程度描述:51. 极差:R ,同全距,各种分布,但一般 单峰、对称、小样本2•四分位数间距:P 75— P 25,(不对称,两端无确切值,分布不明确),P 25, P 50, P 75,共三点将全部观察值分为四部分3. 方差:总体 氏样本S 2 (计算时除以自由度n-1)。

单峰对称。

4. 标准差:总体b,样本So 单峰对称,对数变换后正态或近似正态使用 几何标准差。

5. 变异系数:CV=S/X *100% o 适用不同计量单位(身高和体重),或均数相差很大正态分布及其应用:N (卩,b )特征:4①横轴上方均数处最高;②均数为中线,左右对称;③位置参数 /总体均数卩,形态参数/标准差 b ④曲线下面积分布有一定3. 相对比:两个有关联的指标比值(变异系数,相对危险度,比值比 ..)应用注意:①足够的观察单位数;② 不能以构成比代替率,事物部各组分所占比重不能说明某现象发生的频率或强度大小;③ 分别将分子和分母合计求合计率;④相对数的比较注意可比性,其他的年龄、性别等相同或相近,可分层或标准化再比较;规律,对称,1.645—90.00%,1.96— 95.00%,2.58—99.00%。

6. ________________________________________________ 正态分布:N ( □,曰 经标准化转换 Z_______________7. 制定医学参考限值时,分双侧(土)、单侧,单侧又分只有下限( 定性资料描述:分类/计数资料,性别,疾病感染情况,病情轻重 相对数:31.率:频率(发病率、患病率), 0到1之间;速率(肿瘤患者 =2/125*2 *100% ) 0 到®o 2. 构成比:为标准正态分布/Z 分布:Z (0,1)-)、只有上限(+)o...,相对数进行统计描述。

5年生存率),分母乘以时间数(125人追踪2年死亡2人,年死亡率〜有无差异)⑤样本率、样本构成比应做假设检验再比较(是比较其所代表的总体率的标准化:标准化率:p' = N i P i(p i被标化组死亡率,N i标准组年龄别人口,N标准组总人口)丨N丨标准化死亡率比:SMR=被标化组实际死亡数/预期死亡数被标化组实际死亡数=本年龄组死亡率*标准组本年龄组人口(用被标化组年龄别死亡率去预测标准人口中可能死亡人数)总体均数的估计:抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。

样本均数的标准差=均数的标准误,其估计值:卜月(进行一次抽样即可估计均数标准误)t分布t X-A X-上,v n 1(总体均数的区间估计,t检验…)S X S/ J nt分布特征:①以t=0为左右对称的单峰分布;②曲线形态取决于自由度大小,n越小,|s X|越大,样本LX间差异越大,nTa, t分布就是标准正态分布(Z分布)总体均数的估计:点估计用区]作为卩,无法评价可信程度。

区间估计:21、单样本:n不论大小,卩双侧(1- a )置信区间X t/2,v S X(确切法)n > 100,t 接近Z,g双侧(1- a )置信区间X Z /2, v S X(1.645 1.96 2.58)(正态近似法)2、两样本:两总体均数差值的置信区间:(卩1 -g 2)为X1-X2t /2- (t与Z根据条件可互换)I 2 /2,v X1 X 2t检验:Student's t检验,从样本均数推总体均数条件:①t检验,单样本中,nv 50,总体正态分布②t'检验,两小样本,总体正态分布,但两样本总体方差不等。

公式好复杂,P 96③ Z 检验,两大样本,n 均〉50,单峰、近似正态。

1、单样本t 检验:样本所代表的总体均数卩与已知总体均数卩 o 比较 tX-s X-^v n 1 S ^s Q~n ,2、配对t 检验:①配对的两受试对象分别接受 2种不同处理;②同一样品用两种方法或仪器检测;③同一受试对象两不同部位测定数 据。

H o 为两总体均数相同,差值的样本均数 [所代表的总体均数 胡为0,则丄 d-^d d -0d’t, v n 1SdS d / n S d /、n3、两独立样本/成组t 检验:两样本分别正态分布,H o 为两总体均数相等,则4、两样本几何均数t 检验:(抗体滴度等)不服从正态,但服从对数正态,公式同成组 t 检验正态性检验:①图示法:P-P 图法,Q-Q 图法②统计检验法:W 检验(nw 50),矩法检验(总体偏度、峰度), D 检验方差齐性检验:①两总体方差齐性检验,判断两总体方差是否相等, F 检验② 多样本方差齐性检验:q 检验! !! Levene 检验(可两总体),Bartlett 检验。

用于方差分析。

方差分析ANOVA/F 检验:总体均数之间差别?多样本均数的比较,通过对 数据变异的分析来推断两个/多个样本均数所代表的总体均数是否有差别。

应用条件:①各样本是相互独立的随机样本,均服从 正态;②各样本总体方差相等,即 方差齐性。

总变异:数据的均方 MS 总,处理影响+随机误差(个体差异+测量误差)组间变异:MS 组间,处理因素的影响组变异:MS 组,随机误差的影响(n 为对子数)①n i 、n 2不论大小,tX i X 2「2 1 1 S c ( )\ n1 n2v n 1 n 2 2(确切法)s 2(较大) FS((较小),n 1 1, v 2 n 2 1(进行假设检验, =0.10,查F 界值表)②m 、(正态近似法)F MS组间(服从自由度分子v i,分母V2)MS组内1、完全随机设计资料:成组设计的多个样本〜,单因素两水平/多水平方差分析。

3变异同质的受试对象随机分配到各处理组,各组样本含量相等或不等。

SS总=ss 组间+SS组X2 CMS总----------------------------N 1MS组间SS组间v组间V总=V组间+V组v 总=N-1 V 组间=k-1 V 组=N-k F MS细间(服从自由度分子w,分母V2) v1组间,v2组MS组内注意:总体均数不全相同,两两之间比较用另外的方法2、随机区组设计资料;配伍组设计,两因素。

3变异受试对象按照性质分成b个区组/配伍组,每个区组随机分配到k个处理组。

MS 总=MS 处理组+MS 区组+MS 误差MS = S^ v总中处理组+v区组+v误差=(处理-1)+(区组-1)+误差=N-1v (X )2 ~N~MS处理F处理,v处理MS F区组MS区组MS误差v区组同理:总体均数不全相同,两两之间比较用另外的方法。

3、多个样本均数两两比较,即上面的“注意”、“同理”①SNK法,q检验②Dunnett-t检验4、交叉设计资料,分两阶段和多阶段(X)两阶段交叉设计:一、二组患者和A、B处理方法,一患者服药顺序A T B,二组患者BT Ao6、重复测量资料|x21检验:样本率或构成比推总体率/构成比之间两个及以上的比较1、独立样本列联表资料1)2 X 2列联表(四格表)成组连续性校正(Yates校正)3种2① (n 40, T 5)x2 ------------ (a d_b c)J!-------(a b)(a c)(d b)(d c)5、析因设计资料注意:①必须绝对数,不能相对数,因x 2与频数有关;② 理论频数太小:1/5以上格子的理论频数v 5,或一个格子理论频数v 1。

相关主题