当前位置:文档之家› 考试试题汇总

考试试题汇总

名词解释1.标准差和标准误标准差:是方差的正平方根,反映一组数据的平均离散水平。

标准误:通常将样本统计量的标准差称为标准误。

2.率和构成比4次率:又称频率指标,说明一定时期内现象发生的频率或强度。

构成比:又称构成指标,说明某一事物各组成部分所占的比重或分布。

3.偏回归系数和标准化偏回归系数偏回归系数:在多元回归分析中,随机因变量对各个自变量的回归系数,表示各自变量对随机变量的影响程度。

标准化偏回归系数:多元回归分析中,因各自变量的单位不同,需对数据标准化,得到的相应的回归系数即标准化偏回归系数。

标准化偏回归系数与偏回归系数的关系:b′j=b j√l jjl YY=b j(S jS Y)4.参数检验与非参数检验4次参数检验:对总体分布为已知的数学形式的总体参数所作的假设检验称为参数检验。

如对计量资料的正态分布总体均数作假设检验的t检验和F检验。

非参数检验:相对于参数检验而言的,又称任意分布检验,它直接对总体分布作假设检验。

适用范围广,常用的是秩转换的非参数检验。

5.参数和统计量参数:是指总体的统计指标,如总体均数,总体率等。

总体参数是固定的常数。

多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。

统计量:是指样本的统计指标,如样本均数,样本率等。

样本统计量可用来估计总体参数,其是在总体参数附近波动的随机变量。

6.复相关系数与决定系数复相关系数:R=√R2,用来度量应变量Y与多个自变量间的线性相关程度,也即观察值Y与估计值Ŷ之间的相关程度。

决定系数:R2直线回归于相关中的重要统计量,定义为回归平方和与总平方和之比,反映回归贡献的相对程度,也就是在Y的总变异中回归关系所能解释的百分比。

7.Sx与Sp 2Sx即样本均数标准误,用来描述抽样误差的大小。

Sp即样本率的标准差,用来描述样本率的抽样误差。

8.S与SxS是样本的标准差,是反映样本数据的平均离散水平,表示观察值的变异程度。

Sx是均数标准误,是反映均数间的离散程度,也反映样本均数与相应总体均数间的差异,说明均数抽样误差的大小。

9.相关系数和复相关系数2相关系数:又称Pearson积差相关系数,以符号r表示样本相关系数,用来说明具有直线关系的两变量间相关的密切程度与相关系数。

无单位,大小在-1和1之间。

复相关系数:R=√R2,用来度量应变量Y与多个自变量间的线性相关程度,也即观察值Y与估计值Ŷ之间的相关程度。

10.主效应与单独效应主效应:是指某一因素各水平间的平均差别。

单独效应:是指其他因素的水平固定式,同一因素不同水平间的差别。

11.正态分布与标准正态分布正态分布:又称Gauss分布,其曲线呈钟型曲线,以均数μ为中心,左右对称的分布,记为X~N(μ,σ2)。

标准正态分布:以0为均数,标准差为1的正态分布,记u~N(0,12),任何正态分布都可以通过转换成标准正态分布。

简答题1.I性错误和II型错误有何区别与联系?了解这两类错误有何实际意义?答:I型错误是指拒绝了实际上成立的H0所犯的“弃真”错误,其概率大小用α表示。

II型错误则是“接受”了实际上不成立的H0所犯的“取伪”错误,其概率大小用β表示。

当样本含量n确定时,α愈小,β愈大;反之α愈大,β愈小。

了解这两类错误的实际意义在于,若在应用中要重点减少α(如一般的假设检验),则取α=0.05;若在应用中要重点减少β(如方差齐性检验,正态性检验或想用一种方法代替另一种方法的检验等),则取α=0.01或0.02甚至更高。

2.简述二项分布、Poisson分布、正态分布三者的关系。

答:正态分布是常见的连续性分布,二项分布和Poisson分布均为离散型分布。

当n很大时,π很小时,二项分布近似Poisson分布。

二项分布在当n很大,π和(1-π)较小时,即nπ和n(1-π)均大于5时,可近似正态分布。

Poisson分布当μ较大,如>20时,近似正态分布。

3.什么是抽样误差?抽样误差产生的原因?如何度量抽样误差?答:由于个体变异产生的,抽样造成的样本统计量与总体参数的差异,称为抽样误差。

抽样误差产生的原因:1)抽样单位的数目。

其他条件不变,抽样单位的数目愈多,抽样误差越小,反之亦然。

因为这样样本数目就越接近总体。

2)总体被研究标志的变异程度。

其他条件不变,总体标志的变异程度越小,抽样误差越小。

3)抽样方法的选择。

采用不重复抽样比采用重复抽样的抽样误差小。

4)抽样组织方式不同。

采用不同的组织方式,会有不同的抽样误差,这是因为不同的抽样组织所抽中的样本,对于总体的代表性也不同。

用标准误表示抽样误差的大小。

标准误越小,说明抽样误差也越小。

4.试述直线相关与回归的区别和联系。

答:联系:1)对于既可做相关又可做回归分析的同一组数据,计算出的b与r正负号一致;2)相关系数与回归的假设检验等价,即对于同一样本,tb=tr;3)同一组数据的相关系数和回归系数可以互相换算:r=b Y·X×Sx/Sy;4)用回归解释相关:由于决定系数r2=SS回/SS总,当总和平方和固定时,回归平方和的大小决定了相关的密切程度,回归平方和越接近总平方和,则r2越接近1,说明相关的效果越好。

联系:1)资料要求上:相关要求X、Y服从双变量正态分布,这种资料进行回归分析称为II型回归;回归要求Y在给定某个X值时服从正态分布,X是可以精确测量和严格控制的变量,称为I型回归。

2)应用上:说明两变量间互相关系用相关,此时两变量的关系是平等的;而说明两变量间依存变化的数量关系用回归,说明Y如何依赖于X的变化。

3)意义上:r说明具有直线关系的两变量间相互关系的方向和密切程度;b表示X每变化一个单位所导致Y的平均变化量。

4)计算上:r=l xy√l xx l xy⁄⁄,b=l xy l xx⁄。

5)取值范围:-1≤r≤1,-∞<b<∞。

6)单位:r没有单位,b有单位。

5.标准差与标准误有何区别与联系?答:标准差:S=√∑(x−x)2n−1,表示观察值的变异程度。

可用于计算变异系数,确定医学参考值范围,计算标准误。

标准差是个体差异或自然变异,不能通过统计方法来控制。

标准误:s x=√n,是估计均数抽样误差的大小。

可用于估计总体均数的可信区间,进行假设检验。

可通过增打样本量来减少标准误。

6.试说明x±1.96S与x±1.96Sx的区别答:前者表示的是呈正态分布的变量的95%双侧参考值范围,即正常人群中95%的人该指标的取值范围。

但是当原变量不服从正态分布,则不应用正态分布法估计参考值范围,而应用百分位数法;后者表示的是总体均数的95%双侧可信区间,即该可信区间有95%的可能性包括了真实的总体均数。

并且,无论原变量服不服从正态分布,只要样本含量足够,则根据大数定理都是成立的。

7.进行参数估计时应考虑哪些问题?答:参数估计是指用样本指标值(统计量)推断总体指标值(参数),包括点估计和区间估计两种方法。

1)样本容量,样本容量越大,参数估计的准确性越高;2)样本变量信息,充分利用样本中每一变量的信息。

8.可信区间的含义是什么?应用可信区间时应注意哪些事项?可信区间的含义是:如果能够进行重复抽样试验,平均有1-α(95%)的可信区间包含了总体参数,而不是总体参数落在该范围的可能性为1-α。

可信区间估计的优劣取决于两方面:一是可信度1-α,即区间包含总体均数μ的理论概率大小,当然它愈接近1愈好;二是区间的宽度,对于双侧可信区间而言,区间愈窄愈好。

当样本含量为定值时,上述二者互相矛盾。

应用可信区间时应注意:1)不能只顾提高可信度,因为这样可信区间会变宽,势必会降低可信区间的实际应用价值。

需要兼顾准确度和精确度。

2)在可信度确定的情况下,增加样本含量可减小区间宽度,提高精密度。

9.可信区间与假设检验有何联系与区别?答:区别:可信区间用于说明量的大小即推断总体均数的范围,而假设检验用于推断质的不同即判断两总体均数是否不等。

可信区间亦可回答假设检验的问题,算得的可信区间若包含了H0,则按α水准,不拒绝H0;如不包含H0,则按α水准,拒绝H0,接受H1。

联系:1)可信区间不但能回答差别是否有统计学意义,而且还能比假设检验提供更多的信息,即提示差别有无实际的专业意义。

2)可信区间不能够完全代替假设检验,可信区间只能在预先规定的概率——检验水准α的前提下进行计算,而假设检验能够获得一个较为确切的概率P值。

故将二者结合起来,才是完整的分析。

10.假设检验时,一般当P≤0.05,则拒绝H0,理论依据是什么?答:P值系由H0所规定的总体做随机抽样,获得等于及大于(或等于及小于)依据现有样本信息所计算得的检验统计量的概率。

当P≤0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于α,因为小概率事件几乎不可能在一次试验中发生,所以拒绝H0。

同时,下“有差别”的结论的同时,我们能够知道可能犯错误的概率不会大于α,也就是说,有了概率的保证。

11.t检验与u检验的应用条件有哪些?答:t检验应用条件:样本含量n较小时(如n<60) 1)正态分布2)方差齐性u检验应用条件:样本含量n较大,或n虽小但总体标准差已知 1)正态分布 2)方差齐性12.为什么说随机化配对设计比两组完全随机化设计的实验效率要高?答:随机化配对设计中,每个区组内的实验单位有较好的同质性,比完全随机设计减少了误差,因而更容易返现处理组件的差别,进而提高实验的效率。

13.试述应用相对数应该注意的问题?答:1)分析时构成比和率不能混淆,构成比说明事物内部各部分所占的比重或分布,不能说明某现象发生的强度或频率大小。

2)使用相对数时,分母不宜过小,分母过小时结果不稳定。

观察单位数少时最好用绝对数表示。

3)要注意资料的可比性,用以比较的资料应是同质的,除了研究因素外,其余的因素应相同或相近。

4)要注意使用率的标准化对于内部构成不同的资料,应先进性标准化后再做比较。

5)要考虑存在抽样误差,样本之间的差异应做统计学检验。

14.随机区组设计的方差分析与完全随机设计方差分析在设计和变异分解上有什么不同?答:15.正态分布与标准正态分布联系与区别?答:标准正态分布的均数为0,标准差为1;正态分布的均数为μ,标准差为σ(μ为任意数,而σ为大于0的任意数)。

标准正态分布的曲线只有一条,而正态分布曲线是一簇。

任何正态分布都可以通过标准正态分布转换为标准正态分布。

标准正态分布是正态分布的特例。

分布类型对称对称集中趋势μμ=0均数与中位数的关系μ=M μ=M16.对于四格表资料,如何正确选用检验方法?1)首先应分清是两样本率比较的四格表资料还是配对设计的四格表资料。

2)对于两样本率的比较的四格表资料,应根据各格的理论值T和总例数n的大小选择不同的计算公式:①当n≥40且所有的T≥5时,用χ2检验的基本公式χ2=∑(A−T)2T或四格表资料χ2检验的专用公式χ2=(ad−bc)2n(a+b)(c+d)(a+c)(b+d);当n≥40但有1≤T<5时,用四格表χ2资料检验的校正公式χ2=∑(|A−T|−0.5)2T或χ2=(|ad−bc|−0.5)2n(a+b)(c+d)(a+c)(b+d),或改用四格表资料的Fisher确切概率法;③当n<40,或T<1时,用四格表资料的Fisher确切概率法。

相关主题