第一章绪论习题一、选择题1.统计工作与统计研究得全过程可分为以下步骤:(D)A、调查、录入数据、分析资料、撰写论文B、实验、录入数据、分析资料、撰写论文C、调查或实验、整理资料、分析资料D、设计、收集资料、整理资料、分析资料E、收集资料、整理资料、分析资料2、在统计学中,习惯上把(B )得事件称为小概率事件。
A、B、或C、D、E、3~8A、计数资料B、等级资料C、计量资料D、名义资料E、角度资料3、某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。
该资料得类型就是( A)。
4、分别用两种不同成分得培养基(A与B)培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长得活菌数如下,A:48、84、90、123、171;B:90、116、124、225、84。
该资料得类型就是(C )。
5、空腹血糖测量值,属于( C)资料。
6、用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。
该资料得类型就是(B )。
7、某血库提供6094例ABO血型分布资料如下:O型1823、A型1598、B型2032、AB型641。
该资料得类型就是(D )。
8、100名18岁男生得身高数据属于(C )。
二、问答题1.举例说明总体与样本得概念、答:统计学家用总体这个术语表示大同小异得对象全体,通常称为目标总体,而资料常来源于目标总体得一个较小总体,称为研究总体。
实际中由于研究总体得个体众多,甚至无限多,因此科学得办法就是从中抽取一部分具有代表性得个体,称为样本。
例如,关于吸烟与肺癌得研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取得一定量得个体则组成了研究得样本。
2.举例说明同质与变异得概念答:同质与变异就是两个相对得概念。
对于总体来说,同质就是指该总体得共同特征,即该总体区别于其她总体得特征;变异就是指该总体内部得差异,即个体得特异性。
例如,某地同性别同年龄得小学生具有同质性,其身高、体重等存在变异。
3.简要阐述统计设计与统计分析得关系答:统计设计与统计分析就是科学研究中两个不可分割得重要方面。
一般得,统计设计在前,然而一定得统计设计必然考虑其统计分析方法,因而统计分析又寓于统计设计之中;统计分析就是在统计设计得基础上,根据设计得不同特点,选择相应得统计分析方法对资料进行分析第二章第二章统计描述习题一、选择题1.描述一组偏态分布资料得变异度,以(D )指标较好。
A、全距B、标准差C、变异系数D、四分位数间距E、方差2.各观察值均加(或减)同一数后(B )。
A、均数不变,标准差改变B、均数改变,标准差不变C、两者均不变D、两者均改变E、以上都不对3.偏态分布宜用(C )描述其分布得集中趋势。
A、算术均数B、标准差C、中位数D、四分位数间距E、方差4、为了直观地比较化疗后相同时点上一组乳腺癌患者血清肌酐与血液尿素氮两项指标观测值得变异程度得大小,可选用得最佳指标就是(E )。
A、标准差B、标准误C、全距D、四分位数间距E、变异系数5、测量了某地152人接种某疫苗后得抗体滴度,宜用(C )反映其平均滴度。
A、算术均数B、中位数C、几何均数D、众数E、调与均数6、测量了某地237人晨尿中氟含量(mg/L),结果如下:尿氟值:0、2~0、6~1、0~1、4~1、8~2、2~2、6~3、0~3、4~3、8~频数: 75 67 30 20 16 19 6 2 1 1宜用(B )描述该资料。
A、算术均数与标准差B、中位数与四分位数间距C、几何均数与标准差D、算术均数与四分位数间距E、中位数与标准差7.用均数与标准差可以全面描述(C )资料得特征。
A、正偏态资料B、负偏态分布C、正态分布D、对称分布E、对数正态分布8.比较身高与体重两组数据变异度大小宜采用(A )。
A、变异系数B、方差C、极差D、标准差E、四分位数间距9.血清学滴度资料最常用来表示其平均水平得指标就是(C )。
A、算术平均数B、中位数C、几何均数D、变异系数E、标准差10.最小组段无下限或最大组段无上限得频数分布资料,可用(C )描述其集中趋势。
A、均数B、标准差C、中位数D、四分位数间距E、几何均数11.现有某种沙门菌食物中毒患者164例得潜伏期资料,宜用(B )描述该资料。
A、算术均数与标准差B、中位数与四分位数间距C、几何均数与标准差D、算术均数与四分位数间距E、中位数与标准差12.测量了某地68人接种某疫苗后得抗体滴度,宜用(C )反映其平均滴度。
A、算术均数B、中位数C、几何均数D、众数E、调与均数二、分析题1.请按照国际上对统计表得统一要求,修改下面有缺陷得统计表(不必加表头)答案:性别年龄组21~30 31~40 41~50 51~60 61~70男10 8 82 213 22女14 14 37 49 、2.某医生在一个有5万人口得社区进行肺癌调查,通过随机抽样共调查2000人,全部调查工作在10天内完成,调查内容包括流行病学资料与临床实验室检查资料。
调查结果列于表1。
该医生对表中得资料进行了统计分析,认为男性肺癌得发病率高于女性,而死亡情况则完全相反。
表1 某社区不同性别人群肺癌情况性别检查人数有病人数死亡人数死亡率(%) 发病率(%)男1050 6 3 50、0 0、57女950 3 2 66、7 0、32合计2000 9 5 55、6 0、451)该医生所选择得统计指标正确吗?答:否2)该医生对指标得计算方法恰当吗?答:否3)应该如何做适当得统计分析?表1 某社区不同性别人群肺癌情况性别检查人数患病人数死亡人数死亡比(‰) 现患率(‰)男1050 6 3 2、857 5、714女950 3 2 2、105 3、158合计2000 9 5 2、5 4、53.1998年国家第二次卫生服务调查资料显示,城市妇女分娩地点分布(%)为医院63、84,妇幼保健机构20、76,卫生院7、63,其她7、77;农村妇女相应得医院20、38,妇幼保健机构4、66,卫生院16、38,其她58、58。
试说明用何种统计图表达上述资料最好。
答:例如,用柱状图表示:第三章抽样分布与参数估计习题一、选择题1.(E )分布得资料,均数等于中位数。
A、对数B、正偏态C、负偏态D、偏态E、正态2、对数正态分布得原变量就是一种( D )分布。
A、正态B、近似正态C、负偏态D、正偏态E、对称3、估计正常成年女性红细胞计数得95%医学参考值范围时,应用( A、)。
A、B、C、D、E、4、估计正常成年男性尿汞含量得95%医学参考值范围时,应用(E )。
A、B、C、D、E、5.若某人群某疾病发生得阳性数服从二项分布,则从该人群随机抽出个人,阳性数不少于人得概率为(A )。
A、B、C、D、E、6.分布得标准差与均数得关系就是( C )。
A、B、C、=D、=E、与无固定关系7.用计数器测得某放射性物质5分钟内发出得脉冲数为330个,据此可估计该放射性物质平均每分钟脉冲计数得95%可信区间为(E )。
A、B、C、D、E、8.分布得方差与均数分别记为与,当满足条件(E )时, 分布近似正态分布。
A、接近0或1B、较小C、较小D、接近0、5E、9.二项分布得图形取决于( C )得大小。
A、B、C、与D、E、10.(C )小,表示用该样本均数估计总体均数得可靠性大。
A、B、C、D、E、四分位数间距11.在参数未知得正态总体中随机抽样,(E )得概率为5%。
A、1、96B、1、96C、2、58D、E、12.某地1992年随机抽取100名健康女性,算得其血清总蛋白含量得均数为74g/L,标准差为4g/L,则其总体均数得95%可信区间为(B )。
A、B、C、D、E、13.一药厂为了解其生产得某药物(同一批次)得有效成分含量就是否符合国家规定得标准,随机抽取了该药10片,得其样本均数与标准差;估计该批药剂有效成分平均含量得95%可信区间时,应用(A )。
A、B、C、D、E、14.在某地按人口得1/20随机抽取1000人,对其检测汉坦病毒IgG抗体滴度,得肾综合征出血热阴性感染率为5、25%,估计该地人群肾综合征出血热阴性感染率得95%可信区间时,应用(E )。
A、B、C、D、E、15.在某地采用单纯随机抽样方法抽取10万人,进行一年伤害死亡回顾调查,得伤害死亡数为60人;估计该地每10万人平均伤害死亡数得95%可信区间时,应用(D )。
A、B、C、D、E、16.关于以0为中心得分布,错误得就是(A )。
A、相同时,越大,越大B、分布就是单峰分布C、当时,D、分布以0为中心,左右对称E、分布就是一簇曲线二、简单题1、标准差与标准误得区别与联系答:标准差:S=,表示观察值得变异程度。
可用于计算变异系数,确定医学参考值范围,计算标准误。
标准差就是个体差异或自然变异,不能通过统计方法来控制。
标准误: ,就是估计均数抽样误差得大小。
可以用来估计总体均数得可信区间,进行假设检验。
可以通过增大样本量来减少标准误2、二项分布得应用条件答:(1)各观察单位只能具有两种相互独立得一种结果(2)已知发生某结果得概率为,其对立结果得概率为(1)(3)n次试验就是在相同条件下独立进行得,每个观察单位得观察结果不会影响到其她观察单位得结果。
3、正态分布、二项分布、poisson分布得区别与联系答:区别:二项分布、poisson分布就是离散型随机变量得常见分布,用概率函数描述其分布情况,而正态分布就是连续型随机变量得最常见分布,用密度函数与分布函数描述其分布情况。
联系:(1)二项分布与poisson分布得联系,当n很大,很小时,为一常数时,二项分布近似服从poisson分布(2)二项分布与正态分布得联系,当n较大,不接近0也不接近1,特别就是当与都大于5时,二项分布近似正态分布(3)poisson分布与正态分布得联系,当时,poisson分布近似正态分布。
三、计算分析题1、如何用样本均数估计总体均数得可信区间答:用样本均数估计总体均数有3种计算方法:(1)未知且小,按t分布得原理计算可信区间,可信区间为(2)未知且足够大时,t分布逼近分布,按正态分布原理,可信区间为(3)已知,按正态分布原理,可信区间为2、某市2002年测得120名11岁男孩得身高均数为146、8cm,标准差为7、6cm,同时测得120名11岁女孩得身高均数为148、1cm,标准差为7、1cm,试估计该地11岁男、女童身高得总体均数,并进行评价。
答:本题男、女童样本量均为120名(大样本),可用正态近似公式估计男、女童身高得总体均数得95%置信区间。
男童得95%CI为=(145、44,148、16)女童得95%CI为=(146、83,149、37)3、按人口得1/20在某镇随机抽取312人,做血清登革热血凝抑制抗体反应检验,得阳性率为8、81%,求该镇人群中登革热血凝抑制抗体反应阳性率得95%可信区间。