简答题0. 算术均数、几何均数和中位数各有什么适用条件?答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。
(2)几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态分布)的资料,以及等比数列资料。
(3)中位数:适用各种类型的资料,尤其以下情况:A资料分布呈明显偏态;B资料一端或两端存在不确定数值(开口资料或无界资料);C资料分布不明。
1. 对于一组近似正态分布的资料,除样本含量n夕卜,还可计算X,S和X -1.96S,问各说明什么?(1)X为算数均数,说明正态分布或近似正态分布资料的集中趋势(2)S为标准差,说明正态分布或近似正态分布的离散趋势(3)X—1.96S可估计正态指标的95%勺医学参考值范围,即此范围在理论上应包含95%勺个体值。
2. 试述正态分布、标准正态分布的联系和区别止态分布标准正态分布原始值X无需转换作u= (X-1)/ (T 转换分布类型对称对称集中趋势11 1 =0均数与中位数的关系ji =M 1 =M参考:标准正态分布的均数为0,标准差为1;正态分布的均数则为□,标准差为(T (卩为任意数,而C为大于0的任意数)。
标准正态分布的曲线只有一条,而正态分布曲线是一簇。
任何正态分布都可以通过标准正态变换转换成标准正态分布。
标准正态分布是正态分布的特例。
3. 说明频数分布表的用途。
1)描述频数分布的类型2)描述频数分布的特征3)便于发现一些特大或特小的可疑值4)便于进一步做统计分析和处理4. 变异系数的用途是什么?多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。
5. 试述正态分布的面积分布规律。
(1)X轴与正态曲线所夹的面积恒等于1或100%(2)区间卩±6的面积为68.27%,区间卩±.96 c的面积为95.00%,区间卩±2.58 c的面积为99.00%。
6. 试举例说明均数的标准差与标准误的区别与联系。
匚答,例如某医生从某地2000年的正常成年男性中.随机抽取25人•算得其血红蛋白的均数X为138. 5g/L,标准差5为5. 20g/L,标准误&为1. 04g/L t在本例中标准差就是描述25名正常成年男性血红蛋白变异程度的指标,它反映了这25个数据对其算术均数时离散情况.因此标准差是描述个休值变异程度的抬标•为方差的算术平方根,该变异不能通过统计方法来控制.而标准误则是摘样本统计量的标准差*均数的标准误实质是样本均数的标准差,它反映了样本均数的离散程度,反映了样本均数与总体均数的差异,说明了均数的抽样误差’本例均数的标准误=学=锻=1弋4此式将标准差和-/25 标准误从数学上有机地联系起来同吋还可以看岀:当标准差不变时,通过增加样本含童可以减少标准误。
7. 标准正态分布(u分布)与t分布有何不同?t分布为抽样分布,标准正态分布(u分布)为理论分布。
t分布比正态分布的峰值低,且尾部翘得更高。
随着自由度的增大,t分布逐渐趋近于标准正态分布。
即当自由度S时,t分布一标准正态分布。
8. 均数的可信区间与参考值范围有何不同?土答:均数的可信区间与参考值范围的区别主要体现在含义、计算公式和用途三方而的不同,具体如下表所示。
区别点均数的可信区间参考值范围意义按预先给定的概率所确定的未知参数的町能范围。
实际上一次抽样算得的可信区间要么包含了总体均数,要么不包含。
但可UT说;该可信区间冇多大(如当盘=6 05时为95%)的可能性包含了总体均数"正常人粹的解副、生理、生化某项指标的波动范围计算公式_, Q *(T未知找士爲和 =A(7已知:X士%农¥a未知但r?>60;X士坷吃¥正态分布找士%摆S…偏态分布9•假设检验时,一般当P<0.05时,则拒绝H),理论根据是什么?4.答:P值是指从川。
规定的总体随机抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量值(如r或小的概率。
当P<0. 05时,说明在成立的条件匚得到现有检验结果的概率小于通常确定的小概率事件标准0.05.因小概率事件在一次试验中几乎不可能发生•现的确发生了*说明现有样本信息不支持円「所以怀疑原假设耳不成立,故拒绝H-在下“有差别竹的结论的同时.我们能够知道町能犯1型错误的概率不会大于0. 05(即通常的检验水准几这在概率上有了保证。
10. 假设检验中:•和P的区别何在?5■答法和尸均为概率,其中a是指拒绝了实际上成立的Ho所犯错误的最大概率. 是进行统计推断时预先设定的一个小概率事件标准.P值是由实际样本获得的.在成立的前提条件下,出现等于及大于(或/和等于及小于)现有样本获得的检验统计量值的概率。
在假设检验中通常是将P 与哎对比来得到结论,若P<a,则拒绝儿“接受有统计学意义「可以认为……不同或不等;否则,若P>a,则不拒绝Hi无统计学意义,还不能可以认为……不同或不等口11. t检验的应用条件是什么?7.对单样本I检验要求资料服从正态分布星对配对t检验要求差值服从正态分布;对两样本F 检验则要求两纽数据均服从正态分布*且两样本对应的两总体方差相等•对两小样本尤其要求方差齐性口12.1型错误与II型错误有何区别与联系?I型错误是指拒绝了实际上成立的H。
所犯的“弃真”错误,其概率大小用a表示。
II型错误则是“接受”了实际上不成立的H。
所犯的“取伪”错误,其概率大小用B 表示。
当样本含量n确定时,a愈小,B愈大;反之a愈大,B愈小。
13. 假设检验和区间估计有何联系?假设检验用于推断质的不同即判断两个(或多个)总体参数是否不等,而可信区间用于说明量的大小即判断总体参数的范围。
两者既互相联系,又有区别。
假设检验与区间估计的联系在于可信区间亦可回答假设检验的问题,若算得的可信区间包含了Ho,则按a水准,不拒绝Ho ;若不包含Ho,则按a水准,拒绝H。
,接受比。
也就是说在判断两个(或多个)总体参数是否不等时,假设检验和可信区间是完全等价的。
14. 为什么假设检验的结论不能绝对化?因为通过假设检验推断作出的结论具有概率性,其结论不可能完全正确,有可能发生两类错误。
拒绝H o时,有可能犯I型错误;“接受” H o时可能犯II型错误。
无论哪类错误,假设检验都不可能将其风险降为0,因此在结论中使用绝对化的字如“肯定”,“一定”,“必定”就不恰当。
15. 方差分析的基本思想和应用条件是什么?方差分析的基本思想就是根据试验设计的类型,将全部测量值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用(或几个因素的交互作用)加以解释,如组间变异S&间可由处理因素的作用加以解释。
通过比较不同变异来源的均方,借助F分布作出统计推断,从而推论各种研究因素对试验结果有无影响。
方差分析的应用条件:①各样本是相互独立的随机样本且来自正态总体②各组总体方差相等,即方差齐性。
16. 在完全随机设计方差分析中SSi间、SSi内各表示什么含义?SS组可表示组间变异,指各组处理样本均数大小不等,是由处理因素(如果有)和随机误差造成的;SSa内表示组内变异,指各处理组内变量值大小不等, 是由随机误差造成的。
17. 随机区组设计的方差分析与完全随机设计方差分析在设计和变异分解上有什么不同?区别点完全随机设计随机区组设计设计采用完全随机化的分组方法,随机分配的次数要重复多次,每次随将全部试验对象分配到g个处机分配都对同一个区组内的受试对理组(水平组),各组分别接受象进行,且各个受试对象数量相同,不同的处理。
区组内均衡。
变异分解三种变异:四种变异:SS、= SS&间+ SS&内SS、=SSt 理+ $$组+SS误差18. 以实例说明为什么不能以构成比代替率?Z答:例如某医生研究已婚育龄妇女在不同情况下放置宫内节育器与失败率的关系。
总失败人数为126人,人工流产后失败人数为7&月经后失败人数为39,哺乳期失败人数为9。
由此计算得到人工流产后失败人数的百分数为61.9%,月经后为3L()^,哺乳期为三者比较得岀人工流产后最容易发生避孕失败,这个结论是不对的。
因为作者只考虑了失败人数•计算得到的指标是构成比,只能说明放置宫内疔育器失败者各占的比例。
若要了解失败率,一定要用失败人数除以放置宫内节育器人数。
如人工流产后放置宫内节育器255例失败78例,失败率是30. 6%卡月经后放置宫内节育器87例失败的例,失败率是44〉%;哺乳期内放置宫内节育器17例失败9例,失败率是52.9%,1E 确结论应该是哺乳期内放环最容易发生避孕失败。
19. 秩和检验的优缺点?•答:非参数检验对总体分布不作严格假定、不受总体分布的限制段又称任意分布检验,它直接对总体分布(或分布位置〕作假设检验。
•‘一竝2*答:秩转换的非参数检验是先将数值变量从小到大申或等级从弱到强转换成秩后, 屛讣算检验统计址,其特点是假设检验的结果对总体分布的形状差别不敏感•只对总体分布的位賢差别敏感。
它适用于:不满足止态或(和)方差齐性的小样本计量资料$分布不知是否正态的小样本资料;一端或两端是不确切数值的资料;等级资料.20. 简述直线回归与直线相关的区别与联系联系1对于既可做相关又可做回归分析的同一组数据,计算出的b与r正负号一致。
2相关系数与回归的假设检验等价,即对于同一样本,tb=tr3同一组数据的相关系数和回归系数可以互相换算:r=by,x*Sx/Sy4用回归解释相关:由于决定系数r二ss^ / ss、,当总和平方和固定时,回归平方和的大小决定了相关的密切程度,回归平方和越接近总平方和,则r2越接近1,说明相关的效果越好。
二者的区别:(1)资料要求上:相关要求X、丫服从双变量正态分布,这种资料进行回归分析称为U型回归;胡桂要求丫在给定某个X值时服从正态分布,X是可以精确测量和严格控制的变量,称为I型回归。
(2)应用上:说明两变量间互相关系用相关,此时两变量的关系是平等的;而说明两变量间依存变化的数量关系用回归,说明丫如何依赖于X而变化。
(3)意义上:r说明具有直线关系的两变量间相互关系的方向和密切程度;b表示X每变化一个单位所导致丫的平均变化量。
(4)计算上:r = 1xy / J xx / 1xy,b _ 1xy/ 1xx(5)取值范围:-1 < r < 1,- g vbv x.。