均数±2.58标准差:表示集中位置、离散程度均数±2.58标准误:表示平均水平、抽样误差大小P75一、标准差的主要作用是估计正常值的范围实际应用中,估计观察值正常值范围应该用标准差(s),表示为“Mean±SD”。
此写法综合表达一组观察值的集中和离散特征的变异情况,说明样本平均数对观察值的代表性。
s 的大或小说明数据取值的分散或集中。
s与样本均数合用, 主要是在大样本调查研究中, 对正态或近似正态分布的总体正常值范围进行估计。
如果不是为了正常值范围估计,一般不用。
当数据与正态分布相差很大,或者虽为正态分布, 但样本容量太小(小于30 或100),也不宜用估计正常值范围。
二、标准差还可用来计算变异系数(CV)当两组观察值单位不同, 或两均数相差较大时,不能直接用标准差比较其变异程度的大小, 须用变异系数系数来做比较。
:2.2 标准误的正确使用一、标准误用来衡量抽样误差的大小和了解用样本平均数来推论总体平均数的可靠程度。
在抽样调查中,往往通过样本平均数来推论总体平均数,样本标准误适用于正态或近似正态分布的数据, 是主要描述小样本试验中,样本容量相同的同质的多个样本平均均数间的变异程度的统计量。
即如果多次重复同一个试验, 它们之间的变异程度用。
显然它越小,样本平均数变异越小,越稳定,用样本平均数估计总体均数越可靠。
因此,为说明它的稳定性、可靠性或通过几个对几组数据进行比较(这是科研论文中最常见的),应当用描述数据。
实际应用中应该写成“平均数±标准误”或而英文表示为“Mean±SE”的形式。
二、标准误还可以进行总体平均数的区间估计与点估计(置信区间)。
根据正态分布原理,与合用还可以给出正态总体平均数的可信区间估计即推论总体平均数的可靠区间,例如常用(其中t0.05 (n-1) 为样本容量是n的t界值)表示总体均值的95%可信区间, 意指总体平均数有95%的把握在所给范围内。
三、标准误还可用来进行平均数间的显著性检验,从而判断平均数间的差别是否是由抽样误差引起的。
例如:某当地小麦良种的千粒重=34克,现在从外地引入一新品种,通过多小区的田间试验得到千粒重的平均数=35.2克,问新引进品种千粒重与当地良种有无显著差异?新引进品种千粒重与当地良种有无显著差异实质是判断与的差别是否是有田间试验是抽样误差引起,所以要进行显著性检验,这里用t测验进行检验,而,由于,故,所以认为新引进品种千粒重与当地良种千粒重的不同是由于田间试验是抽样误差引起,因此他们之间无显著差异。
所以在进行平均数间的显著性检验是必须用到。
总之,标准差和标准误最常用的统计量,二者都是衡量样本变量(观察值) 随机性的指标,只是从不同角度来反映误差,二者在统计推断和误差分析中都有重要的应用。
如果没有标准差,人们就无法看出一组观察值间变异程度有多大,这些数字到底有无代表性,如果没有标准误又很难看出我们的样本平均数是否可以代表总体平均数。
所以二者都非常重要。
定量资料的统计描述:频数分布表:全距,R=最大值-最小值;组距=全距/组数,(组数8-9人一组) 频数分布图:直方图 集中位置的描述:平均数31.算数均数:μ总体均数,X 样本均数。
适用定量资料,对称分布,正态或近似正态2.几何均数:G ,适用变量值呈倍数关系,偏态尤其对数变换后正态或近似正态3.中 位 数:M ,各种分布(不对称,两端无确切值,分布不明确),正态等于算数均数,对数正态等于几何均数。
离散程度描述:51.极差:R ,同全距,各种分布,但一般单峰、对称、小样本2.四分位数间距:P 75—P 25,(不对称,两端无确切值,分布不明确),P 25,P 50,P 75,共三点将全部观察值分为四部分3.方差:总体σ2,样本S 2(计算时除以自由度n-1)。
单峰对称。
4.标准差:总体σ,样本S 。
单峰对称,对数变换后正态或近似正态使用几何标准差。
5.适用不同计量单位(身高和体重),或均数相差很大正态分布及其应用:N(μ,σ2)特征:4①横轴上方均数处最高;②均数为中线,左右对称;③位置参数/总体均数μ,形态参数/标准差σ;④曲线下面积分布有一定规律,对称,1.645—90.00%,1.96—95.00%,2.58—99.00%。
6.正态分布:N (μ,2σ)经标准化转换为标准正态分布/Z 分布:Z (0,1)7.制定医学参考限值时,分双侧(±)、单侧,单侧又分只有下限(-)、只有上限(+)。
定性资料描述:分类/计数资料,性别,疾病感染情况,病情轻重...,相对数进行统计描述。
相对数:31.率:频率(发病率、患病率),0到1之间;速率(肿瘤患者5年生存率),分母乘以时间数(125人追踪2年死亡2人,年死亡率=2/125*2 *100%)0到∞。
2.构成比:3.相对比:两个有关联的指标比值(变异系数,相对危险度,比值比..) 应用注意:①足够的观察单位数;②不能以构成比代替率,事物内部各组分所占比重不能说明某现象发生的频率或强度大小; ③分别将分子和分母合计求合计率;④相对数的比较注意可比性,其他的年龄、性别等相同或相近,可分层或标准化再比较; ⑤样本率、样本构成比应做假设检验再比较(是比较其所代表的总体~有无差异)。
率的标准化:标准化率:p ’=Np Nii∑(p i 被标化组死亡率,N i 标准组年龄别人口,N 标准组总人口)标准化死亡率比:SMR=被标化组实际死亡数/预期死亡数被标化组实际死亡数=本年龄组死亡率*标准组本年龄组人口(用被标化组年龄别死亡率去预测标准人口中可能死亡人数) 总体均数的估计:抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。
样本均数的标准差=(进行一次抽样即可估计均数标准误) t 分布 1nS/-X S -X t X-===n v ,μμ (总体均数的区间估计,t 检验...)t 分布特征:①以t=0为左右对称的单峰分布;②曲线形态取决于自由度大小,n 越小,X S 越大,样本X 间差异越大,n →∞,t 分布就是标准正态分布(Z 分布)。
总体均数的估计:点估计用X 作为μ,无法评价可信程度。
区间估计:21、单样本:n 不论大小,μ双侧(1-α)置信区间 X v S t X ,2/α±(确切法)n >100,t 接近Z ,μ双侧(1-α)置信区间 X v S Z X ,2/α± (1.645 1.96 2.58)(正态近似法) 2、两样本:两均数之差的标准误:① n 1、n 2不论大小,)11(21221n n S SC X X +=-(确切法) ② n 1、n 2均较大时,t 接近Z ,则221221n S n S SCC X X +=-(正态近似法) 两总体均数差值的置信区间:(μ1-μ2) 为212/21-XX v S t X X -±,α(t 与Z 根据条件可互换) t 检验:Student ’s t 检验,从样本均数推总体均数 条件:①t 检验,单样本中,n <50,总体正态分布。
②t ’检验,两小样本,总体正态分布,但两样本总体方差不等。
公式好复杂,P 96 ③Z 检验,两大样本,n 均>50,单峰、近似正态。
1、单样本t 检验:样本所代表的总体均数μ与已知总体均数μ0比较 1nS/-X S -X t 0X0-===n v ,μμ2、配对t 检验:①配对的两受试对象分别接受2种不同处理;②同一样品用两种方法或仪器检测;③同一受试对象两不同部位测定数据。
H 0为两总体均数相同,差值的样本均数d 所代表的总体均数d μ为0,则 1n/S d n/S 0-d S -d t d d d -====n v d ,μ(n 为对子数)3、两独立样本/成组t 检验:两样本分别正态分布,H 0为两总体均数相等,则① n 1、n 2不论大小,2)2111(21221-+=+-=n n v n n S X X t c ,(确切法)② n 1、n 2均>50,t 接近Z ,22212121n S n S X X Z +-=(正态近似法)4、两样本几何均数t 检验:(抗体滴度等)不服从正态,但服从对数正态,公式同成组t 检验。
正态性检验:①图示法:P-P 图法,Q-Q 图法②统计检验法:W 检验(n ≤50),矩法检验(总体偏度、峰度),D 检验NX C 2)(∑=方差齐性检验:①两总体方差齐性检验,判断两总体方差是否相等,F 检验11(22112221-=-==n v n v S S F ,,(较小)较大)(进行假设检验,α=0.10,查F 界值表) ②多样本方差齐性检验:q 检验!!!Levene 检验(可两总体),Bartlett 检验。
用于方差分析。
方差分析ANOV A/F 检验:总体均数之间差别?多样本均数的比较,通过对数据变异的分析来推断两个/多个样本均数所代表的总体均数是否有差别。
应用条件:①各样本是相互独立的随机样本,均服从正态;②各样本总体方差相等,即方差齐性。
总变异:数据的均方MS 总,处理影响+随机误差(个体差异+测量误差)组间变异:MS 组间,处理因素的影响 组内变异:MS 组内,随机误差的影响21,v v MS MS F 分母(服从自由度分子组内组间=) 1、完全随机设计资料:成组设计的多个样本~,单因素两水平/多水平方差分析。
3变异 同质的受试对象 随机分配到各处理组,各组样本含量相等或不等。
SS 总=SS 组间+SS 组内 1XMS 2总--=∑N CNX C k Cn X v ii221/SS MS )(,)(组间组间组间∑∑∑=--==V 总=V 组间+V 组内v总=N-1 V 组间=k-1 V 组内=N-k 21,v v MS MS F 分母(服从自由度分子组内组间=) v1组间,v2组内 注意:总体均数不全相同,两两之间比较用另外的方法。
2、随机区组设计资料;配伍组设计,两因素。
3变异受试对象按照性质分成b 个区组/配伍组,每个区组随机分配到k 个处理组。
MS 总=MS 处理组+MS 区组+MS 误差vSS =MS v 总=v 处理组+v 区组+v 误差 =(处理-1)+(区组-1)+误差=N-1处理误差处理处理,v MS MS F =区组误差区组区组,v MS MS F =同理:总体均数不全相同,两两之间比较用另外的方法。
)540(≥≥T n ,3、多个样本均数两两比较,即上面的“注意”、“同理” ①SNK 法,q 检验 ②Dunnett-t 检验 4、交叉设计资料,分两阶段和多阶段(×)两阶段交叉设计:一、二组患者和A 、B 处理方法,一患者服药顺序A →B ,二组患者B →A 。