当前位置:文档之家› 生物统计学(版)杜荣骞课后习题答案统计数据的收集与整理

生物统计学(版)杜荣骞课后习题答案统计数据的收集与整理

第一章统计数据的收集与整理1.1算术平均数是怎样计算的?为什么要计算平均数?n、yi -4 y = _答:算数平均数由下式计算:n ,含义为将全部观测值相加再被观测值的个数除,所得之商称为算术平均数。

计算算数平均数的目的, 是用平均数表示样本数据的集中点, 或是说是样本数据的代表。

1.2既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差?答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。

1.3标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之 间有什么不同?答:变异系数可以说是用平均数标准化了的标准差。

在比较两个平均数不同的样本时所得结果更可靠。

1.4完整地描述一组数据需要哪几个特征数?答:平均数、标准差、偏斜度和峭度。

1.5下表是我国青年男子体重(kg )。

由于测量精度的要求,从表面上看像是离散型数 据,不要忘记,体重是通过度量得到的, 属于连续型数据。

根据表中所给出的数据编制频数 分布表。

序和计算结果如下:proc format; value hfmt 56-57='56-57' 62-63='62-63'68-69='68-69' 70-71=70-71' 72-73=72-73' 74-75=74-75:run;data weight;in file 'E:\data\exer1-5e.dat';646666264766 5 7 13 4 66 6 6 666 64644 6 10 3 6 6 6 7 6 9 6 12 76 6 6 6 616 4 3 7 6 6 6 6 614 2 8 7 6 6 6 6 6 566 7667464756266646464696464666464646662 72616664666666661答:首先建立一个外部数据文件,名称和路径为:626666726462772E:\data\exer1-5e.dat 。

所用的 SAS 程58-59='58-59' 64-65='64-65' 60-6仁'60-61' 66-67='66-67'in put bw @@;run;proc freq;table bw;format bw hfmt.;run;The SAS SystemCumulative CumulativeBW Freque ncy Perce nt Freque ncy Perce nt56-573 1.03 1.058-594 1.37 2.360-61227.3299.762-634615.37525.064-658327.715852.766-677725.723578.368-694515.028093.370-7113 4.329397.772-735 1.729899.374-7520.7300100.01.6将上述我国男青年体重看作一个有限总体,用随机数字表从该总体中随机抽出含量为10的两个样本,分别计算它们的平均数和标准差并进行比较。

它们的平均数相等吗?标准差相等吗?能够解释为什么吗?答:用means过程计算,两个样本分别称为y1和y2 ,结果见下表:The SAS SystemVariable N Mea n Std DevY1 10 64.5000000 3.5039660Y2 10 63.9000000 3.1780497随机抽出的两个样本,它们的平均数和标准差都不相等。

因为样本平均数和标准差都是统计量,统计量有自己的分布,很难得到平均数和标准差都相等的两个样本。

1.7从一个有限总体中采用非放回式抽样,所得到的样本是简单的随机样本吗?为什么?本课程要求的样本都是随机样本,应当采用哪种抽样方法,才能获得一随机样本?答:不是简单的随机样本。

从一个有限总体中以非放回式抽样方法抽样,在前后两次抽样之间不是相互独立的,后一次的抽样结果与前一次抽样的结果有关联,因此不是随机样本。

应采用随机抽样的方法抽取样本,具体说应当采用放回式抽样。

n n送(y「—丁2=送山—y)2, 其中y: = yi士c。

y;=业、、/ =Cy1.8证明i# 若用C或y i 一Cy i编码时,前式是否仍然相等?答: (1 )令 y i 二 y i —c则 y'y —C平均数特性之③。

n2Z (yTJi 4 n 八 Wi _c 一 y _c 2 i 4n 2=s(y i — y)i 4n2、y i -yi 4F- x 2y i y ; <Cc 丿n_ i- c"用第二种编码方式编码结果,两式不再相等。

1.9有一个样本:y i ,y 2,…,y n ,设B 为其中任意一个数值。

证明只有当B= y 时,n' y-B 2i 吕 最小。

这是平均数的一个重要特性,在后面讲到一元线型回归时还会用到该特性。

阮(y_B (答:令P 八,y -B 2,为求使p 达最小之B ,令 ?B-1.10检测菌肥的功效,在施有菌肥的土壤中种植小麦,成苗后测量苗高,共100株,数据如下⑴:10.0 9.3 7.2 9. 1 8.5 8. 0 10.5 10.6 9.6 10.1 7.06.79.57. 10.5 7. 8.19.67.69.48 910.07.5 7.2 5. 7.3 8.7.1 6.1 5.2 6.8710.09.97.54. 7.6 7. 9.76.28.06.958.3 8.6 10.04. 4.9 7.8.3 8.4 7.8 7.5 8 06.6 10.0 6.5 9. 5 8.5 11.0 9.7 6.6 10.0 5.0 6.58.08.4 8. 7.47. 8.17.77.57.13 47.87.6 8.66. 7.0 6.6.76.3 6.4 11.0410.57.85.0 8. 7.0 7.5.26.79.08.644.6 6.93.56.9.7 6. 5.8 6.4 9.36.4(2)令则平均数特性之②。

n=zi 1则2'r —B"B Jyn2 4编制苗高的频数分布表,绘制频数分布图,并计算出该样本的四个特征数。

答:首先建立一个外部数据文件,名称和路径为:E:\data\exr1-10e.dat。

SAS程序及结果如下:opti ons no date;|_proc format;value hfmt3.5-4.4='3.5-4.4' 4.5-5.4='4.5-5.4' 5.5-6.4='5.5-6.4'6.5-7.4='6.5-7.4' 7.5-8.4='7.5-8.4' 8.5-9.4='8.5-9.4'9.5- 10.4=95-104 10.5-11.4='10.5-11.4:run;data wheat;in file 'E:\data\exr1-10e.dat';in put height @@;run;proc freq;table height;format height hfmt.;run;proc capability graphics n opri nt;var height;histogram/vscale=co unt;in set mean var skew ness kurtosis;run;The SAS SystemThe FREQ ProcedureCumulative Cumulative height Freque ncy Perce nt Freque ncy Perce nt3.5-4.41 1.001 1.004.5-5.499.001010.005.5-6.41111.002121.006.5-7.42323.004444.007.5-8.42424.006868.008.5-9.41111.007979.009.5-10.41515.009494.0010.5-11.46 6.00100100.0021Ma-xi-Z-TQI?!!SL MTOI前.U朋町hurtua -B.曲I fitT.S a.4 a.c1.11北太平洋宽吻海豚羟丁酸脱氢酶(HDBH )数据的接收范围频数表调整)in.aI2】如下:(略作HDBH数据的接收范围-1/(U L )频数<2141<245.909 13<277.818 211<309.727 319<341.636 426<373.545 522<405.454 511<437.363 613<469.272 76<501.181 83<533.090 92根据上表中的数据作出直方图。

纹嵴有许多特答:以表中第1.12灵长类手掌和脚掌可以握物一侧的皮肤表面都有突起的皮肤纹嵴。

征,这些特征在胚胎形成之后是终生不变的。

人类手指尖的纹型,大致可以分为弓、箕和斗三种类型。

在手指第一节的基部可以找到一个点,从该点纹嵴向三个方向辐射,这个点称为三叉点。

弓形纹没有三叉点,箕形纹有一个三叉点,斗形纹有两个三叉点,记录从三叉点到箕或斗中心的纹嵴数目称为纹嵴数( fin ger ridge cou nt, FRC)。

将双手十个指尖的全部箕形纹的纹嵴数和/或斗形纹两个纹嵴数中较大者相加,称为总纹嵴数( total fin ger ridge cou nt, TFRC)。

下表给出了大理白族人群总纹嵴数的频数分布⑶:TFRC分组中值频数11~3020231~5040151~7060871~90802991~11010054111~13012063131~15014068151~17016051171~19018018191~2102006首先判断数据的类型,然后绘出样本频数分布图,计算样本的四个特征数并描述样本分布形 ^态。

答:总纹脊数属计数数据。

计数数据的频数分布图为柱状图,频数分布图如下:mi 90 JV4I [却1-U1 |心I [齡*4ii屮值样本特征数(以TFRC的中值计算)SAS程序:optio ns no date; data tfrc;do i=1 to 10; in put y @@; in put n @@;do j=1 to n; output;en d;en d;cards;20 240 160 880 29100 54 120 63 140 68 160 51 180 18 200 6 run;proc means mean std skew ness kurtosis; var y;run;结果见下表:The SAS SystemAn alysis Variable : YMea n Std Dev Skew ness Kurtosis126.5333333 32.8366112 -0.2056527 -0.0325058从频数分布图可以看出,该分布的众数在第七组,即总纹脊数的中值为140的那一组。

相关主题