当前位置:文档之家› 医学统计学历年考题及答案

医学统计学历年考题及答案

试题】2010-01-05/山东大学/医学院/2009级/研究生/医学统计简答1 给了一张表,计算患病率,发病率,病死率,以及患者哪个年龄段最多,是多少,发病率哪个年龄段最多,是多少等等2 一个单向有序资料(分组变量无序,指标变量有序),用了卡方检验,问你对不对为什么如果是你,用什么3 假设检验的基本思想和原则4 给了多元线性回归的资料(列出了几个方程的校正决定系数,决定系数,剩余标准差等的数值),判断哪个方程回归效果最好,为什么5 给了甲流的例子,用某药治疗,用了自身对照(用药前后抗体浓度变化为指标),得出了药物有效。

问你合不合理,为什么你的设计是什么6一型错误和二型错误的区别和联系7什么是抽样误差举例说明分类资料和数量资料的抽样误差计算1 给了健康人的白天和晚上血压的相关数值(x和y各自的平均数,和,平方和,以及两者差值的均数等)注:计算时直接带入公式的相关数值(1)比较白天晚上血压有无差别(配对t检验计算)(2)白天和晚上血压有无相关(相关分析)(3)如何用白天血压估计晚上血压(回归分析)2 多个平均值进行总体假设检验。

类如几种药的作用效果是否相同(方差分析)(也有人说:一个大题,3问,第一问是配对t检验计算,第二问相关分析,第三问,回归分析,都是计算题15分)3 样本率与总体率的比较 (u检验)(也有人说:配伍组方差分析)20081. 列出样本标准误的估计值的公式,至少五个(包括两样本差值的标准误,两样本率差值的标准误等)2. 医学统计中,将正态分布视为近似正态分布有哪几种情况列出应用条件和公式3. 数值资料的统计描述指标公式4. 多元回归模型的基本形式参数含义回归效果的评价5. 什么叫截尾值产生原因举例说明6. 一同学两样本率的比较用了卡方检验,你有什么建议若不符合卡方检验的应用条件,你又有什么建议他再比较三个样本率是否来自同一总体,也用了卡方检验,你又有什么建议7. 一个三因素的2X2X2的析因设计的实验设计及分析思路8. 给了一个数值资料:小鼠的饮食量X1,X2,X3,X4,X5,X6,X7,X8,X9共十个数值小鼠的体重增加量也有十个值(1)对体重增加量资料进行统计描述(2)求饮食量和体重增加量的关系(3)由体重增加量的样本估计其代表总体均数的可信区间(4)求小鼠体重增加量为X5(就是从体重增加量的那十个値里取了一个)的95%的置信区间(5)(3)和(4)中的可信区间有什么差别20061直线回归中的b与多元线性回归中的B有什么区别多元线性回归中,是否可以用B来表示各自变量对因变量的影响为什么2数值变量的完全随机设计的样本与总体的比较,配对设计的两样本的比较,成组设计两样本比较的统计分析思路3统计分析中,B以及1-B的意义4给了一个单向有序资料,统计效应是有序的,他用了t检验,问你对不对,为什么应该用什么统计方法,并写出统计思路5有一个两样本的秩和检验的应用题,写思路,不要求计算6生存分析中,有哪些非参数检验的方法两个生存率的比较用什么检验7给了一个实验,测量抗体.样本序列抗体滴度效应是否有效1 1:40 + 是2 1:160 ++ 是....就是几个表格,让你给每个列个表,并且应该用哪些指标来描述.8正态分布,二项分布,poisson分布的可信区间9有两个变量,让你说出分析它们相关的统计分析思路10有个析因设计的题,让你写出检验的思路,好象是还要写出公式.2005(研究生)1.举例说明变量及变量类型。

(10分)答案:变量:在搜集资料时,首先要根据研究目的确定同质观察单位,再对每个观察单位的某项特征进行测量或观察,该特征称为变量。

如身高、体重、疗效等变量按其性质可分为两种类型:(1)数值变量:其变量值是定量的,表现为数值的大小,通常是使用仪器或某种尺度测定出来的,多有度量衡单位。

如身高(cm)、体重(kg)、心律(次/min)、血压(mmHg)等。

(2)分类变量:表现为互不相容的类别或属性,它又分为无序与有序两类:a.无序分类变量:是指所分类别或属性之间无程度或顺序上的差别,如:性别(男、女)血型(A、B、O、AB)等。

b.有序分类变量:是指所分类别或属性之间有程度或顺序上的差别。

如尿糖化验结果按-、+-、+、++、+++分类,疗效按治愈、好转、无效、恶化分组。

2.在假设检验过程中,若设定a为,算得统计量后,得p值为,按a=的检验水准拒绝无效假设。

请对这一结论做出适当的评论,并为此写例假设检验中p值的含义,以及p与a的关系。

(10分)答案:P值为小于检验水准a(),依据“小概率事件在一次随机试验中认为不可能发生”的定理,拒绝H,接受H1,尚可以认为现有样本所代表的总体与已知总体不相等。

所规定的总体中随机抽样时,获得等于及大于(负值为等P值的含义是指从H,可认为现有于及小于)现有样本统计量的概率。

若p>a,按a检验水准不拒绝H样本所代表的总体与已知总体的差别是由抽样误差造成的。

若p<=a,依据“小概率事件在一次随机试验中认为不可能发生”的定理,拒绝H0,接受H1;可认为从已知总体中抽到现有样本的可能性很小,该样本可能来自另一总体。

3.写出数值变量资料中完全随机设计的多个样本比较的统计分析思路(不必写出计算公式)。

(15分)答案:(1)统计描述:描述资料的类型:数值变量资料 频数表资料的分布:正态性检验 服从正态分布:均数、标准差(方差);不服从正态分布,服从对数正态分布:几何均数、几何标准差;偏态分布:中位数、四分位数间距(2)统计推断:资料的设计类型:完全随机设计的多个样本比较分布:正态性检验和方差齐性检验:(1)如果样本服从正态分布且方差齐,就用完全随机设计的多个样本的方差分析来作统计推断;(2)如果样本不服从正态分布或者方差不齐,经变量变换转换为正态分布方差齐,再用方差分析推断;(3)如果变量变换不能使样本服从正态分布且方差齐,就用秩和检验来做统计推断。

4. 写出两变量之间相关关系的分析思路。

(15分)答案:(1)绘制散点图:在直角坐标系内绘制散点图,看两变量之间有没有线性趋势,如果有就做相关分析。

如果两变量都服从双变量正态分布,则做直线相关分析;如果不服从线性模型条件要求即不服从或总体未知的资料,则作Spearman 等级相关分析。

或者进行曲线拟合。

(2)计算直线相关系数r 或者Spearman 秩相关系数r s 。

(3)对相关系数作假设检验,由于抽样误差的存在,即使从p=0的总体中做随机抽样误差,所得的R 值也不一定等于零,应对样本相关系数做假设检验。

根据检验目的,检验假设为:H0:P=0;H1=/0.常用t 检验,212--==n rr s rt r v=n-2,拒绝H0认为两变量间存在直线相关。

(4)总体相关系数的可信区间估计,先对相关系数做Z 变换,估计Z 的可信区间,其分布服从正态分布原理,,按正态分布原理100(1-a )%可信区间(3,3/-+--n u z n u z a a ),再对Z 的可信区间上下限按r=tanh z 进行逆变换。

5.请利用下面的随机数字表将15只小白鼠完全随机的分配到甲、乙、丙3个实验组中,使各组例数相等。

要求写出随机分配方案。

(10分)随机数字表(部分数据)编号 1-10 11-20 21-30 31-40 41-501 22 17 68 65 81 68 95 23 92 35 87 02 22 57 51 61 09 43 95 06 58 24 82 03 472 19 36 27 59 46 13 79 93 37 55 39 77 32 77 09 85 52 05 30 62 47 83 51 62 743 16 77 23 02 77 09 61 87 25 21 28 06 24 25 93 16 71 13 59 78 23 05 47 47 254 78 43 76 71 61 20 44 90 32 64 97 67 63 99 61 46 38 03 93 22 69 81 21 99 215 03 28 28 26 08 73 37 32 04 05 69 30 16 09 05 88 69 58 28 99 35 07 44 75 47答案:先把十五只动物按体重从小到大分别编号:1 2 3 4 5 6 7 8 9 10 11 12 13 14 15;在随机数字表任意指定某行某列,如取第三行的1列开始,向下录入不重复的二位随机数字:16 77 23 02 09 61 87 25 21 28 06 24 93 71 13;对应于十五只动物的编号,对随机数字有小到大编秩得出序号R如下:5 13 7 1 3 11 14 9 6 10 2 8 15 12 4;并规定:一到五号分到甲试验组,六到十号分到乙组,十一到十五号分到丙组;随机分配结果是:甲实验组动物有:1 4 5 11 15;乙组动物为:3 8 9 10 12 ;丙组动物有:2 6 7 13 14。

6. 某试验需在5%和15%两种氧浓度下进行,每种氧浓度下分别使用甲、乙、丙细胞进行抑制。

此研究宜用何种试验设计,并写出设计方案;若每三种药物对K562种实验条件下各观察4个独立的样品,共需多少样品(即样本含量)(10分)答案:此研究宜用析因试验设计,析因设计是一种多因素多水平交叉分组进行全面试验的设计方法,可以研究两个或两个以上因素多个水平的效应,也可以检验各因素间的交互作用;因本试验中有2个试验因素,即氧浓度和药物,一个因素有2个水平,另一个因素有3个水平,而且氧浓度和药物之间可能存在交互作用;因此选用析因试验设计。

设计方案:该试验是一个2X3的析因设计,共有2X3=6个试验组,用a1表示5%的氧浓度,a2表示15%的氧浓度;用b1表示甲药物。

b2表示乙药物,b3表示丙药物。

先按随机分组的原则,将试验动物按随机化原则分配到各组,各组先进行不同试验因素的处理,间隔一段时间后,再把各组之间的处理方法交换,并统计处理的结果。

分析两因素之间有无交互作用及其交互作用的性质。

同时分析两个因素各个水平之间的效应来评价对细胞的抑制作用。

样本含量:2X3X4=247. 某研究者随机测定了某地100例健康成人血清NSE酶(ug/l)含量,请你充分利用该资料所能提供的信息,写出全面的分析思路。

(20分)答案:(1)资料的类型,列频数表,观察分布类型和分布特征:经判断资料为数值变量资料,对该资料作正态性检验,如果资料服从正态分布,进行统计描述,用均数、标准差(方差)来描述资料;不服从正态分布,进行变量变换使其服从正态分布,若是服从对数正态分布,用几何均数、几何标准差来描述资料;若资料服从偏态分布,则用中位数、四分位数间距对资料进行统计描述。

相关主题