当前位置:文档之家› 卫生统计学考研总结

卫生统计学考研总结

1、试述正态分布、标准正态分布以及对数正态分布的联系和区别?2、说明频数分布表的用途?描述频数分布的特征、描述频数分布的类型、便于发现一些特大或特小的可疑值、便于进一步做统计分析和处理3、变异系数的用途?常用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童与成人身高变异程度的比较。

4、试举例说明均数的标准差与标准误的区别与联系?例如某医生从某地2000年的正常成年男性中,随机抽取25人,算得其血红蛋白的均数X 为138.5g/l ,标准差S 为5.20g/L,标准误x S 为1.04g/L ,。

在本例中标准差就是描述25名正常成年男性血红蛋白变异程度的指标,它反映了这25个数据对其均数的离散情况。

因此标准差是描述个体值变异程度的指标,为方差的算述平方根,该变异不能通过统计方法来控制。

而标准误则是指样本统计量的标准差, 均数的标准误实质要均数的标准差,它反映了样本均数的离散程度,也反映了样本均数与总体均数的差异,说明了均数的抽样误差。

本例均数的标准误X S 此式将标准差和标准误从数学上有机地联系起来了,同是可以看出通过增加样本含量方法可以减少标准误。

5、标准正态分布与t 分布有何不同?T 分布为抽样分布,标准正态分布为理论分布。

T 分布比标准正态分布的峰值低,且尾部翘起得要高。

随着自由度的增大,t 分布逐渐趋近于标准正态分布,即当v →∞时,t 分布→标准正态分布。

6、假设检验时,一般当P<0.5时,则拒绝0H ,理论根据是什么?P 值是指从0H 规定的总体随机抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量值(如t 值 或u 值 )的概率。

当P<0.5时,说明在0H 成立的条件下,得到现有检验结果的概率小于通常确定的小概率事件标准0.05.因小概率事件在一次试验中几乎不可能发生,现在的确发生了,说明现有样本信息不支持0H ,所以怀疑原假设0H 不成立,故拒绝0H 。

在下“有差别”的结论的同时,我们能够知道可犯I 型错误的概率不会大于0.05(即通常的检验水准),这在概率上有了保证。

7、均数的可信区间与参考值范围有何不同?8、假设检验中α和P 值区别何在?答:α与P 值均为概率,其中α是指拒绝了实际上成立的0H 所犯错误的概率,是进行统计推断时预先设定的一个小概率事件标准。

P 值是由实际获得的,在0H 成立的前提条件下,出现等于及大于(或/和等于及小于)现有样本获得的检验统计量值的概率。

在假设检验中通常是将P 与α对比来得到结论,若p ≤α,则拒绝0H 接受1H ,有统计学意义,可以认为……不同或不等;否则,若P>α,则不拒绝0H ,无统计学意义,还不能论为……不同或不等。

9、怎样正确选用单侧检验和双侧检验?单双侧检验首先应根据专业知识来确定,同时应考虑所要解决问题的目的。

若从专业知识判断一种方法的结果可能低于或高于另一种方法的结果,则用单侧检验;在尚不能从专业知识判断两种结果谁高谁低时,用双侧检验。

若研究者对低于或高于两种结果都关心,则用双侧检验;若仅关心其中一种可能,则取单侧检验。

一般认为双侧检验较保守和稳妥,单侧检验由于充分利用了另一侧的不可能性,故更易得出有差别的结论,但应慎用。

10、T 检验的应用条件是什么?对于单样本T 检验要求资料服从正态分布;对配对T 检验要求差值服从正态分布;对两样本T 检验则要求两组数据均服从正态分布,且两样本对应的两总体方差相等即要求方差齐性。

11、Ⅰ型错误与Ⅱ型错误有何区别与联系?了解这两类错误有何实际意义?Ⅰ型错误是指拒绝了实际上成立的0H 所犯的“弃真”错误,其概率大小用α表示;Ⅱ型错误是则是“接受了”实际上不成立的0H 所犯的“存伪”错误,其概率大小用β表示;当样本含量n 确定时,α愈小,β愈大;反之α愈大,β愈小;了解这两类错误的实际意义在于,若在应用中要重点减少α,则取α=0.5;若在应用中重点减少β,则取α=0.10或0.20甚至便高。

12、假设检验和区间估计有何联系?假设检验用于推断质的不同即判断两个(或多个)总体参数是否不同,而可信区间用于说明量的大小即推断总体参数的范围。

可信区间可以回答假设检验的问题,若算得的可信区间包含了0H ,则按α水准,不拒绝0H ;若不包含0H ,则按α水准,拒绝0H ,接受1H .置信区间可提供假设检验没有提供的信息,它在回答差别有无统计学意义的同时,还可以提示差别是否具有实际意义。

在统计推断结论为拒绝0H 时,假设检验可以报告确切的P 值,从而较精确地说明检验结论的概率保证。

置信区间只能在预先确定的置信度100(1-α)%水平上进行推断。

在不能拒绝0H 的场合,假设检验可能对检验功效做出估计,从而可以评价是否在识别差异能力较强的情形下不不拒绝0H 。

而置信区间并不提供这方面的信息。

13、为什么假设检验的结论不能绝对化?因为通过假设检验推断作出的结论具有概率性,其结论不可能完全正确,有可能发生两类错误。

拒绝0H 时,可能犯Ⅰ型错误;接受1H 时可能犯Ⅱ型错误。

无论哪类错误,假设检验都 不可能将其分险降为0,因些在结论中使用绝对化的字词如“肯定”就不恰当了。

14、方差分析的基本思想和应用条件是什么?根据试验设计的类型,将全部测量值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用(或某几个因素的交互作有)加以解释,如组间变异SS 组间可同处理的作用加以解释。

通过比较不同变异来源的均方,借助F 分布做出统计推断,从而推论各种研究因素对试验结果有无影响。

方差分析应用的条件:各样本是相互独立的随机样本,均服从正态分布;相互比较的各样本的总体方差相等,即具有方差齐性。

15、在完全随机设计方差分析中SS 组间、SS 组内各表示什么含义?SS 组间表示组间变异,指各处理组样本均数大小不等,是由处理因素作用和随机误差造成的; SS 组内表示组内变异,指各处理组内变量值 大小不等,是由随机误差造成的。

16、为什么在方差分析的结果为拒绝0H 、接受1H 之后,对多个样本均数的两两比较要用多重比较的方法?方差分析的备择假设1H 是G 个总体均数不全相等,拒绝0H ,接受1H ,只说明G 个总体均数总的来说有差别,并不说明两两总体均数都有差别。

若想进一步了解哪两两总体均数不等,则需进行多个样本均数间的多重比较。

17、 随机区组设计的方差分析与完全随机设计方差分析在设计和变异分解上有什么不同?18、常用相对数有哪几种?各种相对数指标的含义、计算方法及特点?有强度相对数(率)、结构相对数(构成比)、相对比三种。

率的含义:某现象实际发生的例数与可能发生的总例数,说明某现象发生的频率或强度。

其特点为:说明某现象发生的强弱。

计算公式:率=某时期内发生某现象的观察单位数/同期可能发生某现象的观察单位总数×比例基数 构成比的含义:事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各总体构成部分在总体中所占的比重或分布,通常以100为比例基数,又称为百分比。

其特点为:①一组构成比的总和应等于100%,即各个分子的总和等于分母:②各构成部分之间是相互影响的,某一部分比重的变化受到两方面因素的影响,其一是这个部分自身数值的变化 ,其二是受其它部分数值变化的影响。

计算公式:构成比=某一组成部分观察单位数/同一事物各组成部分的观察单位数×100%相对比的含义:是两个有关指标之比,说明两指标间的比例关系。

其特点为:两个指标可以是性质相同,也可以是性质不同;两个指标可以是绝对数、相对数或平均数。

计算公式:相对比=甲指标/乙指标(×100%)19、以实例说明为什么不能以构成比代替率?例如某医生研究已婚育龄妇女在不同情况下放置避孕环与失败率的关系。

总失败人数为126人,人工流产后失败人数为78,月经后失败人数为39,哺乳期失败人数为9.由此计算得到人工流产后失败人数的百分数为61.9%,月经后为31.0%,哺乳期为7.1%,三者比较得出人工流产后最容易发生避孕失败,这个结论是不对的。

因为作者只考虑了失败人数,计算得到的指标是构成比,只能说明放置避孕环失败者各占的比例。

若要了解失败率一定要用失败人数除以放环人数。

如人工流产后放环255例失败78例,失败率是52.9%,正确结论应该是哺乳期内放环最容易发生避孕失败。

20、何为标准化法?直接标准化与间接标准化法的区别?采用某影响因素(如年龄、性别)的统一标准构成,然后计算标准化率的方法称为标准化法,其目的是消除原样本内部某因素构成不同对合计率的影响,使通过标准化后的标准化合计率具有可比性。

直接标准化法和间接标准化法的主要区别:如对死亡率的年龄构成标准化,若已知年龄别死亡率,可采用直接法,选择一个标准年龄人口构成直接计算标准化率;若只有总的死亡数和年龄别人口数而缺乏年龄别死亡率,选择一个标准 年龄别死亡率,先计算标准化死亡比(SMR ),再用SMR 乘以标准总死亡率得标准化死亡率。

21、应用标准化率进行比较时要注意什么问题?①标准化只适用于因两组内总构成不同,并有可能影响两组总率比较的情况。

对于因其它条件不同而产生的可比性问题,标准化法不能解决。

②由于选择的标准人口不同,算出的标准化率也不同。

因此,当比较几个标准化率时,应采用同一标准人口。

③标准组应选择有代表性的、较稳定的、数量较大的人群。

④标准化后的标准率,已经不再反映当时当地的实际水平,它只是表示相互比较的资料间的相对水平。

⑤两样本标准化率是样本值,存在抽样误差。

比较两样本的标准化率,还应作假设检验。

22、相对数的动态指标有哪几种?各有何用处?相对数的动态指标即其动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度和平均增长速度。

绝对增长量说明某相对数在一定时期增长的绝对值;发展速度与增长速度均为相对比,说明某相对数在一定时期的速度变化;平均发展速度是各环比发展速度的几何均数,说明某相对数在一个较长时期中逐期(如逐年)平均发展变化的程度。

23、简述二项分布的应用条件?①每次试验只会发生两种互斥的可能结果之一,即两种互斥结果的概率之和恒等于1;②每次试验产生某种结果(如阳性)的概率固定不变③重复试验是互相独立的,即任何一次试验结果的出现不会影响其它试验结果出现的概率24、简述POSSION 分布的性质特征?①总体均数λ与总体方差2σ相等②当N 很大,而π很小,且n π=λ为常数时,Poisson 可看作是二项分布的极限分布;③当λ增大时,Poisson 分布渐近正态分布。

一般而言,λ≥20时,Poisson 分布资料可作为分布处理④Poisson 分布具备可加性。

相关主题