常用医学统计方法统计学是以数学方法观察和比较事物的一门学科。
●变异导致的现象有,个体≠个体;个体≠部分;部分≠部分;部分≠全部上述四种不同如果是变异所致,则不同是表像,相同才是本质。
●鉴于“变异”的存在,当欲判断事物与事物有无不同时,必需考虑排除因变异导致的“假性”不同。
二、基本概念:12AB3、抽样误差:(1)样本指标(均来源于同一总体)之间的差别(2)样本指标与总体指标(样本来源于该总体)之差●应用意义:抽样误差存在的原因是变异。
样本与样本之间存在的抽样误差,并非真正不同,而是“同质”。
4、概率:指事件发生的可能性,用符号“P”表示小概率事件:指P≤0.05( 5% )的事件。
法,每组30(1)上述研究的“真正”对象,是若干还是全体糖尿病患者?(2(3(4)上述“同质”的观察角度分别是:同类病人;同类护理方法;同类效果2、(1(2X :个体观察值,X :样本平均数,μ:总体平均数A、X1≠X2B、X1≠X2C、X ≠XD、X≠μE、μ1≠μ 2三、统计资料种类:资料不同,统计分析方法亦不同。
1、计量2、计数3、等级资料:既有计量又有计数性质(了解)四、统计工作的基本步骤:1.⑴随机:使样本对总体有代表性⑵对照:平行对照(观察组、对照组);自身对照⑶双盲:调查者不知被调查者属于何组,避免诱导误差被调查者不知自己属于何组,避免依从性误差⑷齐同:观察组与对照组的对象,除了被观察因素不同,其他所有条件均应相同。
234⑴以统计指标描述样本资料(频数分析:均数、率等)⑵——(应用在个体水平)⑶以样本指标估计总体情况(总体指标可信限)——(应用在总体水平)⑷判断样本与样本、样本与总体是否同质(假设检验)——(应用在样本水平)2、计算方法:掌握计算器运算方法⑴直接法:略。
⑵加权法:原理(与直接法相比较)以组中值代替原始数据。
●大样本资料可以用直接法计算均数吗?●直接法和加权法计算公式中,“X”的含义有何区别?●直接法与加权法计算均数,那一种结果更精确?二、几何均数(G)12、计算方法:将所有数据(X)取对数(lgX)→求“算术均数”→取反对数三、中位数(M)123、计算方法:(1)直接法:排序及目测位居中间的数据之值(2)频数表法:计算关键——式中:L =i =fm =Σf L=12以δ以S表示。
3δ大表示数据分散,δ小表示数据集中。
4、计算:重点掌握“应用公式”和计算器运算:(1)直接法:(2)加权法:5、应用:(1)标准差反映了一个资料(内部)的变异程度。
(2)在X±1.96S的范围内包含了95%的观察值,故常用X±1.96S计算医学正常值。
1、标准差是表示正态分布计量资料 的统计指标 A 、集中趋势 B 、离散程度C 、频数分布D 、数据最大值与最小值之差3、偏态分布计量资料常用 表示集中趋势A 、MB 、GC 、XD 、S4、调查100名女大学生血清总蛋白含量(g/L ),得:X = 73.82(g/L ),S = 3.91(g/L ) ⑴用公式X ±1.96S 计算,理论上女大学生血清总蛋白95%正常值范围为多少?⑵所计算的正常值范围仅适用于100名女大学生吗?⑸对频数表用计算器计算X 和S 时,掌握正确输入方法。
1、每一个正态分布均能转换为标准正态分布(亦称U 分布)X 1 μ X 2 U 1 0 U 2● 由于对于具体资料,μ与δ是常数。
故每个X 可得到一个U 值,形成U 分布。
如:X=μ时,U=0;X 1与X 2之间包含的面积(数据),与U 1到U 2之间的面积相同; 如果某X 值位于X 1与X 2之间,则对应的U 值必然位于U 1到U 2之间; 如果某X 值大于X 2(或小于X 1),则对应的U 值必然大于U 2(或小于U 1)。
2、标准正态分布下的面积常数:可查表,用于计算医学正常值范围。
● 如:±1.64——90%2.58——99%的面积 将面积常数代入公式X= μ+U δ,即可换算出相同比例的正态分布之面积。
● 即95%的U95%的数据(X )。
● 抽样误差的概念?产生的原因?可以避免吗?怎样缩小抽样误差?1、原理:(1) X 分布与标准误● 许多X 可形成一个X 分布,来源与同一总体的许多X (n 相同)也可形成X 分布。
n 不同时,X 分布也不同。
● 与X 分布相比,X 分布的集中趋势X =μ,离散趋势用(δX )标准误表示。
● 标准误“理论公式”为:δX =δ/ n X S/ n● S X 是δX 的估计值,计算S X ● ;是表示抽样误差大小的统计指标;S X 越小,表示 样本均数X 对μ的代表性越好、越可靠。
● 同样95%的X 分布在μ±1.96δX 区间内(与95%观察值范围计算相类似)U= X - μ δ X= μ+U δ 正态分布 标准正态分布(2)t 分布● 由于实际上不能获得δ,故以S 替代,计算出S X 代替δX 。
可获得t 值。
● t 分布与U 分布一样也是标准分布,但n 不同t 分布不同。
● 与U 值一样,t 值也可由查表而得。
通常只需查t 0.05值。
X=μ±1.96δXμ±t 0.05S X (95%的X 分布范围)X 1 μ X 2 t 1 0 t 2 即当图中t 1与t 2分别取值为±t 0.05时,则μ± t 0.05S X 之间包含了95%的样本均数(X )。
● 当n ≥100时,t 分布已接近U 分布,为了少查表,上式可改为X=μ±1.96S X 1、95% 总体均数可信区间是以X 为中心,两侧均延伸“t 0.05S X ”长度形成的一个区间。
X-t 0.05S X X X+t 0.05S X 2、总体均数可信区间的应用意义:调查在样本水平,应用在总体水平,如保险费的估计。
一、计量资料的假设检验1、 统计检验(假设检验)的前提:所比较的两个X (或X 与μX 1≠X 2 属于抽样误差。
● 经计算t t 检验。
● 当样本含量t 值已接近U 值。
此时可用U 0.05(1.96)代替t 0.05 进行判断。
所进行的均数的比较,称“U 检验”。
2、统计检验(假设检验)步骤 ---- 四步(1)假设、确定检验水平H 0:(无效假设)即假设两个X 所属总体相同,差别为抽样误差。
表达为μ1=μ2 H 1:(备择假设)即假设两个X 所属总体不同,差别为本质差别。
表达为μ1≠μ2 α:(检验水平)通常取5%,表达为α= 0.05t = X - μ S X X = μ+ t S X 正态分布 t 分布(2)计算统计量t=?(当样本含量n <100时) 或 U=?(当样本含量n ≥100时)(3)确定概率值(P 值)通过t 与t 0.05(查表可得)比较,或U 与1.96(U 0.05)比较(4)用文字表达统计结果:?3、均数抽样误差的判断1=0 (如X 2)=μ 不存在抽样误差0.05=0=μ 不存在抽样误差 >t 0.05 95%范围外 差别为本质差别4、t 检验注意事项:⑴ 资料应具备可比性⑵ 均数差别应有实际意义⑶ 选择适宜的统计方法⑷ 结论判断不能绝对化(May be )二、样本均数与总体均数比较(X 与μ比较)例:正常人血清无机磷总体均数为4mg/dl ,某地随机抽取16个成人慢性肾炎患者,检查得血清无机磷均数为5mg/dl ,标准差为1.6mg/dl 。
问该地成人慢性肾炎患者的血清无机磷是否与正常人有区别?(即已知:μ= 4 X = 5 S = 1.6 n=16)临床意义:证实慢性肾炎是否会导致血清无机磷含量的改变,即血清无机磷是否可以作为慢性肾炎的诊断指标或疗效观察指标。
1)H 0:μ=μ0(慢性肾炎患者血清无机磷与正常人相同)H 1:μ≠μ0(慢性肾炎患者血清无机磷与正常人不同)α=0.052)t = X – μ = 5 - 4 = 2.5S X 1.6 163)ν= n-1 = 16-1= 15查t 值表,得t 0.05(15) = 2.131∴ t >t 0.05(15) ∵P <0.054 任选一种三、配对资料的t检验●所组成。
●●统计分析出发点:当μd = 0 的时候,可以因“变异”出现d≠0和因“抽样误差”出现d≠0的现象。
例一:应用克矽平治疗10名矽肺患者,根据下表资料,评价该药能否引起血红蛋白变化?克矽平治疗前后血红蛋白含量患者编号血红蛋白(克/升)治疗前治疗后差数(d)12345678910 113150150135128100110120130123140138140130135120147114138120-2712105-7-20-376-83合计-63 ●差数(d)= 治疗前测定值 - 治疗后测定值就个体而言, d为负数的临床意义? d为正数说明?就样本而言, d为负数的临床意义? d为正数说明?就总体而言,μd为负数的临床意义?μd为正数说明?已知:d = -6.3 S d = 16.76 S d= 16.76 10 = 5.31)H0:μd=0(治疗前后的Hb相同,即d≠0是抽样误差)H1:μd≠0(治疗前后的Hb不同)α= 0.052)t =d –μd=(-6.3)- 0= -1.89S d 5.33)ν= n-1 = 10-1= 9查t值表,得t0.05(9) = 2.262∴t <2.262∵P>0.054四、两样本均数比较(X与X)⑴大样本(两个样本含量均大于100)——U检验某医院研究劳动类型与血清胆固醇的关系,调查结果为脑力劳动组537人,平均胆固醇水平为4.8mmol/L,标准差为0.72mmol/L;体力劳动组643人,平均数为4.6mmol/L,标准差为0.81mmol/L。
问两种劳动者的血清胆固醇水平是否有差别?1)H 0:μ1=μ2 H 1:μ1≠μ2(文字表达?) α= 0.052)U = X 1 – X 2 = 4.8 - 4.6 = 4.4882S 12 S 22 0.722 0.81 n 1 n 2 537 6433) ∴ U >1.96 ∵P <0.054 任选一种⑵小样本:小样本作假设检验时,视n 1 ≠ n 2、或n 1 = n 2 ,公式不同。
甲、乙两方法护理前后的患者血沉(mm/h )病人编号1 3 5 7 9 11 13 15 17 19 甲 法 护理前护理后 10 13 6 11 10 7 8 8 5 9 X 1 6 9 3 10 10 4 2 5 3 3 X 2病人编号2 4 6 8 10 12 14 16 18 20 乙 法 护理前护理后 9 10 9 13 8 6 10 11 10 10 X 3 6 3 5 3 3 5 8 2 7 4 X 4 1.上表资料是某医院将同类患者按入院先后次序编号,然后随机确定单号组给予甲护理 方法,双号组给予乙护理方法,这种分组法属于 方法A.简单随机抽样B.系统抽样C.分层抽样D.整群抽样2.上述研究属于 。