简答题0. 算术均数、几何均数和中位数各有什么适用条件?答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。
(2)几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态分布)的资料,以及等比数列资料。
(3)中位数:适用各种类型的资料,尤其以下情况:A 资料分布呈明显偏态;B 资料一端或两端存在不确定数值(开口资料或无界资料);C 资料分布不明。
1.对于一组近似正态分布的资料,除样本含量n 外,还可计算S X ,和S X 96.1±,问各说明什么?(1)X 为算数均数,说明正态分布或近似正态分布资料的集中趋势(2)S 为标准差,说明正态分布或近似正态分布的离散趋势(3)S X 96.1±可估计正态指标的95%的医学参考值范围,即此范围在理论上应包含95%的个体值。
2.试述正态分布、标准正态分布的联系和区别。
正态分布标准正态分布 原始值X 无需转换作u=(X-µ)/σ转换 分布类型 对称对称 集中趋势 µµ=0 均数与中位数的关系µ=M µ=M 参考:标准正态分布的均数为0,标准差为1;正态分布的均数则为µ,标准差为σ(µ为任意数,而σ为大于0的任意数)。
标准正态分布的曲线只有一条,而正态分布曲线是一簇。
任何正态分布都可以通过标准正态变换转换成标准正态分布。
标准正态分布是正态分布的特例。
3.说明频数分布表的用途。
1)描述频数分布的类型 2)描述频数分布的特征 3)便于发现一些特大或特小的可疑值 4)便于进一步做统计分析和处理4.变异系数的用途是什么?多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。
5.试述正态分布的面积分布规律。
(1)X 轴与正态曲线所夹的面积恒等于1或100%;(2)区间µ±σ的面积为68.27%,区间µ±1.96σ的面积为95.00%,区间µ±2.58σ的面积为99.00%。
6.试举例说明均数的标准差与标准误的区别与联系。
7.标准正态分布(u 分布)与t 分布有何不同?t分布为抽样分布,标准正态分布(u分布)为理论分布。
t分布比正态分布的峰值低,且尾部翘得更高。
随着自由度的增大,t分布逐渐趋近于标准正态分布。
即当自由度ν→∞时,t分布→标准正态分布。
8.均数的可信区间与参考值范围有何不同?9.假设检验时,一般当P<0.05时,则拒绝H0,理论根据是什么?10.假设检验中和P的区别何在?11.t检验的应用条件是什么?12.I 型错误与II 型错误有何区别与联系?I 型错误是指拒绝了实际上成立的0H 所犯的“弃真”错误,其概率大小用α表示。
II 型错误则是“接受”了实际上不成立的0H 所犯的“取伪”错误,其概率大小用β表示。
当样本含量n 确定时,α愈小,β愈大;反之α愈大,β愈小。
13.假设检验和区间估计有何联系?假设检验用于推断质的不同即判断两个(或多个)总体参数是否不等,而可信区间用于说明量的大小即判断总体参数的范围。
两者既互相联系,又有区别。
假设检验与区间估计的联系在于可信区间亦可回答假设检验的问题,若算得的可信区间包含了0H ,则按α水准,不拒绝0H ;若不包含0H ,则按α水准,拒绝0H ,接受1H 。
也就是说在判断两个(或多个)总体参数是否不等时,假设检验和可信区间是完全等价的。
14.为什么假设检验的结论不能绝对化?因为通过假设检验推断作出的结论具有概率性,其结论不可能完全正确,有可能发生两类错误。
拒绝0H 时,有可能犯I 型错误;“接受” 0H 时可能犯II 型错误。
无论哪类错误,假设检验都不可能将其风险降为0,因此在结论中使用绝对化的字如“肯定”,“一定”,“必定”就不恰当。
15.方差分析的基本思想和应用条件是什么?方差分析的基本思想是: 根据研究资料设计的类型及研究目的,把全部观察值总变异分 解为两个或多个组成部分,其总自由度也分解为相应的几个部分。
例如完全随机设计的方差 分析,可把总变异分解为组间变异和组内变异,即SS 总=SS 组内+SS 组间,总的自由度也 分解为相应的两部分,即ν 总=ν 组内+ν 组间。
离均差平方和除以自由度得均方MS ,组间 均方(MS 组间)与误差均方(MS 误差)之比为F 值;如果各组处理的效应一样,则组间均方等 于组内均方,即 F =1;但由于抽样误差,F 值不正好等于1,而是接近 1;如果F 值较大, 远离1,说明组间均方大于误差均方,反映各处理组的效应不一样,即各组均数差别有意义, 至于F 值多大才能认为差别有意义,可查F 界值表(方差分析用)来确定。
方差分析的应用条件:①各样本是相互独立的随机样本且来自正态总体②各组总体方差相等,即方差齐性。
16.在完全随机设计方差分析中SS 组间、SS 组内各表示什么含义?组间SS 表示组间变异,指各组处理样本均数大小不等,是由处理因素(如果有)和随机误差造成的;组内SS 表示组内变异,指各处理组内变量值大小不等,是由随机误差造成的。
17. 随机区组设计的方差分析与完全随机设计方差分析在设计和变异分解上有什么不同?区别点完全随机设计 随机区组设计 设计 采用完全随机化的分组方法,将全部试验对象分配到g 个处理组(水平组),各组分别接受不同的处理。
随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个受试对象数量相同,区组内均衡。
变异分解三种变异:总SS =组间SS +组内SS 四种变异:总SS =处理SS +区组SS +误差SS18.以实例说明为什么不能以构成比代替率?19.秩和检验的优缺点?20.简述直线回归与直线相关的区别与联系。
联系:1对于既可做相关又可做回归分析的同一组数据,计算出的b 与r 正负号一致。
2相关系数与回归的假设检验等价,即对于同一样本,tb=tr3同一组数据的相关系数和回归系数可以互相换算:r=by ,x*Sx/Sy4用回归解释相关:由于决定系数总回ss ss r /2=,当总和平方和固定时,回归平方和的大小决定了相关的密切程度,回归平方和越接近总平方和,则2r 越接近1,说明相关的效果越好。
二者的区别:(1)资料要求上:相关要求X 、Y 服从双变量正态分布,这种资料进行回归分析称为Ⅱ型回归;胡桂要求Y 在给定某个X 值时服从正态分布,X 是可以精确测量和严格控制的变量,称为Ⅰ型回归。
(2)应用上:说明两变量间互相关系用相关,此时两变量的关系是平等的;而说明两变量间依存变化的数量关系用回归,说明Y 如何依赖于X 而变化。
(3)意义上:r 说明具有直线关系的两变量间相互关系的方向和密切程度;b 表示X 每变化一个单位所导致Y 的平均变化量。
(4)计算上:xy xx xy l l l r //=,xx xy l l b /=(5)取值范围:-1≤r ≤1,-∞<b<∞.2、 二项分布、Poission 分布的应用条件 二项分布的应用条件:医学领域有许多二分类记数资料都符合二项分布(传染病和遗传 病除外),但应用时仍应注意考察是否满足以下应用条件:(1) 每次实验只有两类对立 的结果;(2) n 次事件相互独立;(3) 每次实验某类结果的发生的概率是一个常数。
Poisson 分布的应用条件:医学领域中有很多稀有疾病(如肿瘤,交通事故等)资料都符合 Poisson 分布,但应用中仍应注意要满足以下条件:(1) 两类结果要相互对立;(2) n 次试验 相互独立;(3) n 应很大, P 应很小。
3、极差、四分位数间距、标准差、变异系数的适用范围有何异同? 答:这四个指标的相同点在于均用于描述计量资料的离散程度。
其不同点 为: 极差可用于各种分布的资料,一般常用于描述单峰对称分布小样本资料的变 异程度,或用于初步了解资料的变异程度。
若样本含量相差较大,不宜用极差来 比较资料的离散程度。
四分位数间距适用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。
标准差常用于描述对称分布,特别是正态分布或近似正态分布资料的离散程度。
变异系数适用于比较计量单位不同或均数相差悬殊的几组资料的离散程度。
4.中位数、均数、几何均数的适用条件有何异同。
(1)均数适用于描述对称分布,特别是正态分布的数值变量资料的平均水平;(2)几何均数适用于描述原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的数值变量资料的平均水平;(3)中位数适用于描述呈明显偏态分布(正偏态或负偏态),或分布情况不明,或分布的末端有不确切数值的数值变量资料的平均水平。
5.第一类错误与第二类错误的区别与联系。
当假设检验拒绝了实际上成立的零假设时,所犯的错误称为第一类错误,其概率用α表示。
当假设检验接受实际上不成立的零假设时,所犯的错误称为第二类错误,其概率用β表示。
当样本含量一定时,α愈大,β愈小,反之,α愈小,β愈大。
1-β称为检验效能或把握度,其意义是两总体确有差别,按α水准能发现它们有差别的能力。
6.运用相对数时要注意哪些问题?应用相对数时应注意以下几个事项(1)计算率和构成比时观察单位不宜过小;(2)注意正确区分构成比和率,不能以比代率;(3)对率和构成比进行比较时,应注意资料的可比性;(4)当比较两个总率时,若其内部构成不同,需要进行率的标准化;(5)两样本率比较时应进行假设检验。
7.方差分析后进行两两比较能否用t 检验?为什么?t 检验仅用在单因素两水平设计(包括配对设计和成组设计)和单组设计(给出一组数据和一个标准值的资料)的定量资料的均值检验场合;而方差分析用在单因素k 水平设计(k≥3)和多因素设计的定量资料的均值检验场合。
方差分析有十几种,不同的方差分析取决于不同的设计类型。
t 检验进行两两比较其一,将多因素各水平的不同组合、简单地看作单因素的多个水平(即视为单因素水平),混淆了因素与水平之间的区别,从而错误地确定了实验设计类型;其二,分析资料时,常错误用单因素多水平设计或仍采用多次t 检验进行两两比较。
误用这两种方法的后果是,不仅无法分析因素之间的交互作用的大小,而且,由于所选用的数学模型与设计不匹配,易得出错误的结论。
参数检验与非参数检验的区别何在?各有何优缺点?(1)区别:参数检验:以已知分布(如正态分布)为假定条件,对总体参数进行估计或检验。
非参数检验:不依赖总体分布的具体形式,检验分布位置是否相同。
(2)优缺点:参数检验:优点是符合条件时,检验效能高。
缺点是对资料要求严格,如等级资料、分布不明或末端有不明确数据的资料不能用参数检验,要求资料的分布类型已知且总体方差相等。