试卷编号:卷课程名称:医学统计学适用专业:科学学位专业:班级姓名:学号:学院 (系 ):考试日期:题号一二三四五六七八九十总分统分题分30152530100签名得分考生注意事项: 1、本试卷共6 页,请查看试卷中是否有缺页或破损。
如有立即举手报告以便更换。
2、考试结束后,考生不得将试卷、答题纸和草稿纸带出考场。
一、最佳选择题(每题 2 分,共 30 分)得评阅把每题的答案填入下表中:123456789101112131415A B C D B B A C C C B B C D B1、描述一组正态分布资料的集中趋势,以指标为好。
A. 算术平均数;B. 几何平均数;C. 中位数;D. 变异系数2、比较成人身高和儿童身高的离散趋势,宜用。
A. 标准差;B. 变异系数;C. 方差;D. 离均差平方和3、对于正态分布资料,X +1.96S,所对应的面积占总面积的。
A. 95% ;B. 99% ;C. 47.5%;D. 49.5%4、下列说法哪个是错误的?中位数适用于描述资料。
A. 最小组段无下限;B. 最大组段无上限;C. 偏态分布;D. 正态分布5、大,表示用该样本均数估计总体均数的可靠性小。
A. S X;B. S;C.CV;D. Q U—Q L6、某地 1992年随机抽取 100名健康女性,算得其血清总蛋白含量的均数为74g/L ,标准差为 4g/L ,则其 95%的可信区间为。
7、两样本均数比较的t 检验,分别取以下检验水准,以所取第二类错误最大。
A. α =0.01;B. α=0.05;C. α =0.10;D.α=0.208、两样本均数比较的t 检验结果, P<0.05 ,可认为。
A. 两样本均数不等;B. 两样本均数相等;C. 两总体均数不等;D. 两总体均数相等9、完全随机设计的方差分析结果,P≤ 0.05,可认为。
A. 各样本均数不等或不全等;B. 各样本均数都不相等;C. 各总体均数不等或不全等;D. 各总体均数都不相等10、某地某年肝炎发病人数占总人数的5%,这是该地该年肝炎的。
A. 年发病率;B. 年患病率;C. 患病构成比;D. 患者平均数11、已知甲县人口较乙县年青,今欲比较两县死亡率的高低,适当的比较方法是。
A.将两县的总死亡率直接比较;B.对年龄进行标准化后,再比较两县总死亡率;C.将两县的总死亡率进行 t 检验后再比较;D.将两县的总死亡率进行χ2检验后再比较12、下面哪一点不是Poisson 分布的性质。
A. λ =σ2;B. 当λ≥ 20 时,近似正态分布;C. 可加性;D. 相互影响性13、χ2检验中理论数T 的计算式为。
A. n r (1 n c ) ;B. (1 n r ) n c;C. n r n c;D. n r n cN N N N14、已知两组计量资料方差不齐,可用检验。
A. t 检验;B. U 检验;C. F 检验;D. 秩和检验15、对一组既做相关分析又做回归分析的资料,有。
A. b=r ;B. t b=t r;C. b=a;D. r=1二、名词解释 (每题 3 分,共15 分 )得评阅1.总体:总体是根据研究目的所确定的所有同质个体某实际值的集合。
2.变异:变异指的是同质个体中同一观察指标的个体观察值之间的差异。
3.抽样误差:由于个体变异和随机抽样的原因,用样本统计量估计总体参数往往存在误差,称样本统计量与总体参数之间的差异为抽样误差。
4.第一类错误:拒绝实际上成立的 H0,这类“弃真”的错误称为第一类错误,第一类错误的概率常用α表示。
5.参考值范围:参考值是指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理、生化指标常数,也称正常值。
参考值范围是指在正常人群中,95% 对象的观察值范围。
三、简答题 (每题 5 分,共25 分 )得评阅1、简述计量资料统计描述指标体系。
①频数分布:频数表、频数图②集中趋势描述:算术均数、几何均数、中位数、众数③ 离散趋势:极差、四分位数间距、标准差、变异系数、方差2、完全随机实验设计和随机区组实验设计的方差分析,何者检验效能更高,为什么?1.完全随机设计没有把混杂因素(如年龄、体重等)考虑进去,而随机区组设计通过设置区组而使得混杂因素在同一区组内均匀。
2.完全随机设计方差分析属于单向方差分析,随机区组设计方差分析属于双向方差分析。
3.前者变异拆分:SS 总 =SS 组间 +SS 误差(或SS 组内),后者变异拆分:SS 总 =SS 区组+SS 处理 +SS 误差。
故随机区组实验设计得方差分析检验效能更高。
3、率和构成比有何不同?为什么不能以比代率?一、率和比例的概念不同1、率:又称频率指标,是某现象实际发生的观察单位数与可能发生该现象的观察单位总数之比,用以说明某现象发生的频率或强度。
? 率的比例基数可以是百分率,千分率,万分率,十分率等。
应该根据其在医学中的使用习惯来使用。
人口学指标如出生率,死亡率等习惯用千分率;恶性肿瘤的发病率,死亡率一般用万分率或十万分率;住院病人的病死率,床周转率等则常用百分率。
2、比例指标,通常计算构成比,说明某一事物内部各组成部分所占的比重或分布。
常以百分数表示。
二、率和比例的计算方法不同1、率的计算公式为:率=发生某现象的观察单位数/可能发生某现象的观察单位总数*KK 为比例系数,可以为100%, 10000/万 ,100000/ 10 万等。
2、构成比=某一组成部分的观察单位数/同一事物各组成部分的观察单位总数*100%二者说明的问题不同。
构成比只能说明某事物内部各组成部分在全体中所占的比重或分布,不能说明某现象发生的频率或强度。
4.举例说明回归分析的用途:回归分析主要是研究两个变量间的数量依存关系的统计学方法。
例如欲研究血清胆固醇含量与舒张压间是否存在依存关系,可在某大学随机抽取20 名成年男性,测得他们的血清胆固醇含量和舒张压,并对两者指标采用简单线性回归方法进行分析可得是否存在依存关系。
5、简述非参数检验的优缺点,什么情况下会用非参数检验?优点:( 1)对总体分布未做出任何假定,因此适用于任何分布的资料。
如严重偏态分布、分布不明的资料、等级资料或末端无确定数值的资料。
( 2)易于收集资料、统计分析比较简便。
缺点:不直接分析原始测量值,从而有可能会降低它的检验效率。
满足参数检验要求的资料分析时应首选参数检验方法。
不满足参数检验要求的资料应选非参数检验。
适用以下情况: 1.分布不明的小样本计量资料; 2.等级资料; 3.不满足正态和方差齐性条件的小样本计量资料; 4.一端或两端是不确定数值(如<0.5、>5.0等)的计量资料四、计算分析题(每题 15 分,共 30 分 )得评 阅22; u 0.05=1.96; u 0.01=2.58 )(参考界值: χ0.05, 1=3.84 ; χ0.01,1=6.63 1、某地随机抽样调查了360 名健康成年男性的红细胞数,得均数为4.66×1012/L ,标准差为 0.58 ×1012/L 。
请问:①该地健康成年男性红细胞数的均数是多少?②测得某成年男性的红细胞数为 4.00 ×1012/L ,该男性红细胞数是否正常?解:①正常人红细胞数是服从正态分布,此次抽样的样本量为360,大于 100,故近似标准12/L正态分布。
x- u 0.05 ×S x =4.66×10 12-1.96× 0.58 ×1012/√ ̄ 360=4.60 ×1012/Lx+ u 0.05×S x =4.66×10 12+1.96× 0.58 ×10 12/√ ̄ 360=4.72 ×101212)/L 。
该地健康成年男性红细胞数总体均数的 95%可信区间为( 4.60 ×10, ×104.72②H 0: μ=μ 0=4.66×1012/L ,即该男性红细胞数与该地健康成年男性红细胞数均数相等。
H 1:μ ≠ μ 0=4.66×1012/L ,即该男性红细胞数与该地健康成年男性红细胞数均数相等。
α=0.05u=( 4.00 ×1012- 4.66× 1012)/ (0.58 ×1012/ √ ̄ 360 ) =-0.02 ,查表得 P<0.05 。
按 α=0.05 水准,拒绝 H 0,接受 H 1,差异有统计学意义。
故该男性红细胞数属于不正常。
2、某医师在甲、乙两地各调查了 3 万人,观察食管癌的患病情况,结果甲地发现食管癌患者 30 人,乙地发现食管癌患者 20 人。
假定甲、乙两地人口年龄构成相同,问甲、乙两地食管癌患病率有无差别?( 10 分)解:由题意可得,甲、乙两地食管癌服从 Poisson 分布。
H 0: Π 甲 =Π乙 ,甲、乙两地食管癌患病率相等。
α=0.05H 1:Π 甲≠Π ,甲、乙两地食管癌患病率不等。
乙2=60000 ×( 30×29980-20×29970)2/ (30000×30000×50×59950) =2.001 查表得 P<0.05 。
按 α=0.05 水准,拒绝 H 0,接受 H 1,差异有统计学意义。
甲、乙两地食管癌患病率有差别,甲地高于乙地。