【关键字】统计说明:本重点仅供参考:不能包括所有选择题考题,名词和简答可信度高,计算题熟练运算过程;同时自己要清楚各种检验方法的基本思想,重点程度与星号数量相关)一、名词解释1、★★★医学统计学:用概率论和数理统计方法研究医学事件的群体特征的一门方法。
2、★总体:根据研究目的确定的同质的研究对象的全体(集合)。
3、样本:从总体中随机抽取的部分研究对象4、随机:总体中每个个体有同等的机会进入样本。
5、系统误差:指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差6、随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的7、★★抽样误差:由于抽样原因造成的样本指标与总体指标之间的差,或者是样本指标与样本指标之间的差。
8、准确度(accuracy)或真实性(validity):观察值与真值的接近程度,受系统误差的影响(9、可靠度(reliabiliy)——也称精密度(precision)或重复性(repeatability):重复观察时观察值与其均值的接近程度,受随机误差的影响10、★★★小概率事件:一般常将p ≤ 0.05或p ≤ 0.01称为小概率事件,表示某事件发生的可能性很小。
通俗讲一次抽样是不可能发生的事件11、★★正态分布定:又称高斯分布,是一条中间高,两头低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。
12、★★医学参考值范围:指绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。
最常用的是95%参考值范围。
13、★★标准误:用于反映均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度。
14、★95%的可信区间:如果从同一总体中重复抽取100个独立样本,将可能有95个可信区间包括总体均数,有5个可信区间未包括总体均数。
二、填空题1、★医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料2、★统计分析包括:统计描述、统计推断3、频数分布的两个重要特征:集中趋势和离散趋势4、正态分布的两个参数:均数;标准差。
5、★频数表的用途:揭示计量资料的分布类型;揭示计量资料的分布特征;便于发现特大值和特小值;便于进一步进行统计分析6、★常见的统计资料的类型有:计量资料;计数资料;等级资料7、★t检验的应用条件是:①正态分布:当样本含量较小时,要求样本来自正态总体。
②方差齐性:两样本均数比较时,要求两总体方差相等。
U检验的应用条件是:①大样本(如n>50);②小样本,σ已知且样本来自正态总体。
8、★.描述分类变量常用的指标有率、构成比、相对数。
9、率是指某种现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察单位数之比,常用来描述某种现象发生的频率大小或强度构成比是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比,常用来描述某一事物内部各组成部分所占的比重或分布。
10、★四格表卡方专用公式应用条件n≥40,且Tmin≥511、研究事物或现象间的线性关系用相关分析,研究事物或现象间的线性数量依存关系用返回分析。
12、是反映两变量线关系间相关的密切程度与相关方向的指标。
取值范围为-1≤r≤113、★返回系数b 意义是:X 每增加(减)一个单位,Y 平均改变b 个单位14、★制定正常成人肺活量95%参考值范围的公是 。
15、★从总体中抽取样本,一定要遵循科学原则:代表性; 随机性 ;可靠性16、★编制频数表的步骤: 确定全距;确定组距; 确定组段;正字化记:三、判断并改错题1. 科研资料的统计推断包括统计描述和假设检验两部分内容。
2. 相关系数假设检验可代替返回系数假设检验,其结论完全相同。
3. 死因统计中,反映某时、某地居民因某种疾病死亡的水平,应选用该病病死率。
4. 构成比的重要特点是各组成部分的构成比之和必等于100%,而相对比可大于100%,也可小于100%。
5.等级资料采用 检验比采用秩和检验更能充分地说明处理组间的效应有无差别。
6. 估计某地30-49岁健康男子血清总胆固醇值的95%参考值范围,应按 计算。
7. 比较学龄前儿童身高与体重的变异程度时,可以根据其标准差的大小来判断。
8. R×C 表 检验中,若有T<1的情况,适当增加观察单位数是最好的处理办法。
9.只要样本含量足够大,就可以避免 I 型和 I 型错误。
10. 直线返回反映两变量间的依存关系,而直线相关反映两变量间的相关关系。
11. 称作总体均数的(1-α)可信区间,表示总体均数的波动范围。
12.用最小二乘法确定直线返回方程的原则是各观察点与直线的垂直距离的平方和最小。
13.假设检验中,p 值越小,越有理由认为无效假设不成立。
14.同一数值变量资料的均数一定小于标准差。
四、最佳选择题1.表示一组正态分布资料变量值的平均水平,宜选用A. 算术均数( )B. 方差C. 几何均数(G )D. 标准差E. 变异系数2. 为研究缺氧对正常人心率和血压的影响,收集50名志愿者参加试验,随机分为两组,要比较缺氧与非缺氧组收缩压等指标间是否有差别,应采用何种假设检验方法?A .配对设计t 检验B .随机区组设计方差分析C .两独立样本比较的t 检验D .两样本率比较的 检验E .两组资料比较的秩和检验3. 下列有关四分位数间距描述中不正确的是 。
A.四分位数间距= P 75-P 25B.四分位数间距比极差稳定C.四分位数间距即中间50%观测值的极差D.主要用于描述正态分布资料的变异度E.四分位数间距越大,表示变异程度越大4.四组均数比较,经方差分析 ,则备择假设 应为 。
A .4321μμμμ===B .4321μμμμ≠≠≠C .至少有两个样本均数不等D .任两个总体均数间有差别E .各总体均数不等或不全相等5.相对数指标分析中,下列哪种说法正确?A.加权平均率属构成指标B.相对比必须是同类指标之比C.构成比反映某事物现象发生的强度D标化率不反映某现象发生的实际水平E.率可反映某事物现象内部各组成部分的比重。
6.两个小样本数值变量资料比较的假设检验,首先应考虑采用。
A.t检验B.秩和检验C.t检验或秩和检验均可D.u检验E.资料符合t 检验还是秩和检验的条件7. 直线相关系数的假设检验,r>r0.001,34,可认为__________。
A. 回归系数β=0B. 相关系数ρ=0C. 决定系数等于零D. X、Y间线性关系存在E. X、Y差别有统计学意义8.直线相关与回归分析中,下列哪种说法正确__________。
A. |b|≤1 C. 可作回归分析的资料均可作相关分析B. 0<r<1时,b>0 D. X、Y两变量不服从正态分布仍可作积差相关E. r表示X每增加一个单位时,Y平均改变b个单位9.区间的含义是________ 。
A 99 %的总体均数在此范围内B 样本均数的99 %置信区间C 99 %的样本均数在此范围内D 总体均数的99 %置信区间E 99 %的个体值应在此范围10.麻疹疫苗接种后血清阳转率的分母应为__________。
A.麻疹患者人数B.麻疹易感人数C.获得麻疹终身免疫人数D.麻疹疫苗接种人数E.麻疹疫苗接种后的阳转人数五、简述题1. ★★计量资料统计分析中,常用的集中趋势指标有哪些?适用条件有何不同?算术均数、几何均数、中位数,统称为平均数,均反映集中趋势。
算术均数应用:主要适用于对称分布,尤其适合正态分布资料。
几何均数:应用于对数正态分布,也可应用于呈倍数关系的等比资料。
在医院中主要用于抗原(体)滴度资料。
中位数:、适合条件:a、极偏态资料b、有不确定的数据(有>或<)c、有特大值或特小值d、分布不明的资料2. ★离散趋势的指标及适用范围极差适用条件:除了两端有不确定数据之外,均可计算极差。
四分位数间距:用于描述偏态分布资料。
方差和标准差:用于描述正态分布计量资料的离散程度变异系数适用条件:a、均数相差较大,b、单位不同3. ★★★标准差和标准误的联系和区别有哪些?①概念不同:标准差是描述观察值(个体值)之间的变异程度,S越小,均数的代表性越好;标准误是描述样本均数的抽样误差,越小,均数的可靠性越高;②用途不同:标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。
标准误用于估计参数的可信区间,进行假设检验等。
与样本含量的关系不同: 当样本含量n 足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0联系: 标准差、标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。
4. ★★简述非参数检验的适用范围?分布未知未知的计量资料;等级资料;有不确定的数值;各总体方差不齐。
5. ★★Ⅰ型错误和Ⅱ型错误的区别和联系?区别Ⅰ型错误(弃真):拒绝实际成立的H0,型错误的概率记为α。
(1-a)即置信度:重复抽样时,样本区间包含总体参数(μ)的百分数。
当p≤α而拒绝H0时,只能犯Ⅰ型错误,不可能犯Ⅱ型错误。
Ⅱ型错误(存伪): 不拒绝实际不成立的H0,Ⅱ型错误的概率记为β。
(1-β)即把握度(或检验效能):两总体确有差别,被检出有差别的能力。
当p≥α而拒绝H0时,只能犯Ⅱ型错误,不可能犯Ⅰ型错误。
联系对同一资料,α与β反方向变化,若要同时减小α与β,唯一的办法是增加样本含量。
6. ★★★正态分布的特征?①. 在x= μ处最高,以μ为中心的对称分布②左右完全对称下降,但不与横轴相交.③两个参数决定位置和变异④.曲线下面积分布有规律7. ★何谓假设检验,一般步骤?假设检验:是对总体做出某种假定,然后根据样本信息推断总体是否成立的一类统计学方法总称。
假设检验有三个基本步骤:①建立假设和确定检验水准,②选择检验方法和计算检验统计量③确定P 值和做出统计推断结论8. ★假设检验注意事项?①假设检验的前提是要有严密的抽样设计,保证样本是从同质总体中随机抽取。
并且,组间的均衡性和资料的可比性应予特别注意,除了对比的因素外,其它影响结果的因素应尽可能相同或基本相同。
②选用的检验方法应符合其应用条件。
③正确理解差别有无统计意义的涵义。
④结论不能绝对化。
⑤正确选用单侧还是双侧检验。
⑥报告结论时,应列出现有样本检验统计量值,说明采用的单侧还是双侧检验,并列出P值的确切范围。
9. ★应用相对数时的注意事项①计算相对数时分母不能太小②分析时不能以(构成)比代(替)率③总率(平均率)的计算:不能直接相加求和④资料的可比性:两个率要在相同的条件下进行. 研究方法相同、研究对象同质、观察时间相等、地区、民族、年龄、性别等。
⑤率也有抽样误差,要进行假设检验10. ★什么是率的标准化?标准组的选择原则是什么?标准化的注意事项?当比较的两组资料内部各小组率明显不同,且各小组观测例数的构成比也明显不同时,直接比较两个合计率是不合理的。