当前位置：文档之家› 生物统计学

生物统计学

数据资料。（3）具体性：已经实现的事实的记载。
• 主要内容： 1）数据的审核与修订 2）数据的汇总与分组 3）基本统计特征计算 4）用图表展示结果
1.资料的分类
什么是资料（data）？资料有哪些种类？
连续性资料（comtinuous data）? 离散性（间断性）资料（discrete data）? 离散性资料又分成哪两类？
计数资料（counting data）分类资料（categorical data）
1 资料的分类
特点：数字性、大量性、具体性类型：
连续性资料：一定范围内可取任何实数值的数据资料。如：身高离散性资料：一定范围内只取有限值的数据。
计数资料：用计数的方式得到的数据资料，如：人数，鸡蛋数
分类资料：以类别作为分类对象，如：性别
（variate）。
变量在某一个体具体表现出来的数值又称为变数或称观测值（observed value）、数据（data）、资料（data）
变量是和常量（constant）相对应的一个概念
参数和统计量用来描述总体特征的数值称为参数（parameter）由样本观测值计算得到的描述样本特征的数值称为
第二章资料整理
1 资料的分类 2 数据的频率分布 3 数据的表示方法 4 集中趋势的度量计资料：指反映事物、现象或过程的数据资料。包括原始资料和次级资料。
特点：
（1）数字性：数字形式或者可以转换为数字形式。（2）大量性：大量相像或对同类相像观察所取得的
总体与样本的关系：样本必须来自于总体样本必须能代表总体
如：一叶知秋
管窥蠡测尝鼎一脔
总体与样本关系不好的例子：
一叶障目瞎子摸象
变异和变量
在实践中，无论是总体还是样本，无论是调查还是试验，所得到的数值都是有差别的，这种差别在统计学中称为统计数据的变异（variation）
具有变异性质的数值在生物统计学中就称为变量
机误差。在不发生歧义的情况下，随机误差简称为误差如果观测次数足够多的话，随机误差有统计学上的意义
每一次观测所产生的随机误差都是独立发生的，且服从一定的规律通过各种手段可以把随机误差有效地缩小到最低的程度随机误差是进行统计假设检验的基础降低随机误差，可以： 1 提高试验的精确性 2 可以更好地区别误差效应（表面效应）和处理效应，
总体（population）：具有相同性质的所有观测值所组成的集合（set）
在实际工作中只能对总体中具有代表性的一小部分进行研究。被研究的这一小部分观测值（子集 subset）必须来自于这一总体，并具有很好的代表性。这样的一批观测值的子集就称为样本（sample）
从总体中得到样本的过程称为抽样（sampling）
• 分类资料
公称尺度：不同类别之间没有等级之分。如：性别公、母，正常、不正常。
等级尺度：不同类别之间有内在的等级之分。如：成绩的优、良、中。
分类资料的相对数表示（％）：
受精率孵化率出苗率有效率合格率
出栏率上市率情期受胎率死亡率
资料的采集与核对
资料的采集：调查试验
记录
资料的检查与核对：资料的完整性
• B．统计上所指的样本均是指随机样本
• C．保证总体中的每个个体均有相等的概率被抽取作为样本的抽样叫随机抽样，抽得的样本叫随机样本。
• D．通过抽样调查获得的样本是随机样本，用试验方法获得的数据不是随机样本
• 3、研究某肉用仔鸡56天体重，因为该肉用仔鸡是一个极大的群体，其数量是一个天文数字，该总体属于( )。
从畜牧科研实践中所得到的数据资料具有变异性、随机性和复杂性。学习畜牧统计学的目的就是要使用统计学的原理和方法
来定量地处理和分析生物数据的这些变异性、不确定性和复杂性，从而得出最令人信服的结论，以阐明事物发展的规律。畜牧统计学是畜牧学科中的一个重要工具。它能帮助畜牧工作者发现隐藏在纷繁复杂的表面现象下面的客观规律。
如何学习畜牧统计学？
首先，确立统计学的思维方式，学会用统计学的思想来武装自己的头脑，用统计学的思考方式来观察世界，观察周围的事物。
其次，在畜牧科研、技术推广等方面要用好用活统计学，除了学好统计学，掌握统计学的基本原理、计算公式、数学概念和含义、具有一定的电脑知识和操作技能外，还必须有坚固、扎实的畜牧学专业方面的知识，丰富的畜牧实践。
10、调查江苏省2004年全省生猪生产情况时，如果以断奶休重为指标，则该总体是（）
A．无限总体 B．有限总体 C．既不是有限总体又不是无限总体 D．既是有限总体又是无限总休
14、描述样本的特征数为统计量，统计量一般有两个，即平均数和变异数，除了地位特征数外，下述( )是常用的统计量。
A．中位数，算术平均数，几何平均数，方差和标准差
以消灭。
准确度和精确度
准确度和精确度和两类误差密切相关。准确度（accuracy）：指观测值与真值接近的
程度。当发生系统误差时，观测值都会有规律地向某一
个方向偏离真值，因而降低了试验的准确度
精确度（precise）
指在同一处理条件下，同一批观测值间相互接近的程度。
当随机误差较大时，数据较离散，精确度较低。准确度是比精确度更重要的一个概念在任何时候，都应当将系统误差降至零或最小程
全距——极差（range）组距（class interval）
组限（class limit）组中值组下限组上限
次数分布表
次数分布图
离散性资料的频数分布 70头母羊窝产仔数
7 8 11 14 10 12 11 10 10 7 10 12 11 10 10 11 9 12 8 10 10 9 11 12 10 12 9 9 11 10 11 11 13 11 14 13 10 11 13 11 13 10 10 9 11 11 8 9 9 11 10 7 10 13 12 12 13 10 11 9 12 10 10 11 8 10 8 10 11 13
最后，用畜牧统计学处理和分析每一批资料、每一批数据，都必须有充分的生物学意义和畜牧学意义，而所作的试验也必须有生物学科的理论意义和实践意义。
因此，畜牧统计学的学习，统计学方法的应用不能孤立地、单独地进行，它必须紧密结合畜牧学科的实践，以取得具有专业意义和指导意义的结果。
常用统计术语
总体和样本
统计量（statistic）
参数用希腊字母表示，如μ、σ2、β、ρ 统计量用英文字母表示，如x、s2、b、r
参数一般为一常量，需通过样本的统计量来进行估计（estimation）
从同一总体中抽取不同的样本所计算得到的同一性质的统计量是不会相同的，因此统计量是变量
这些统计量都可以用来无偏（unbias）地估计相应的参数
使得试验结果更正确。 3 对试验处理间的差异所作出的评定更准确、更可靠。
错误（mistake）
由于工作人员的粗心大意或不负责任（如仪器使用不当，错读数据，记录不准，任意涂改，凭空杜撰等）所产生的测定值与真值的偏差，称为错误
错误不是统计学的研究内容在试验和调查中，错误应当、必须，同时也可以加
B．众数，算术平均数，几何平均数，方差和标准差
C. 极差，算术平均数，几何平均数，方差和标准差
D．算术平均数，几何平均数，方差和标准差
第二章资料整理
原始数据：
大量的、“杂乱无章” 不能直接用于统计分析，必须经过统整理和加工。
第二章资料整理
资料整理的主要内容
（1）审核与订正：人为错误、小数点等（2）分组与汇总：内部结构、类型和特征（3）计算各种综合数字特征：如，n、平均数、标准差（4）统计表或统计图：显示资料的基本特征和内在规律
系统误差（systematic error）指由于某些特定的非试验条件所造成的使试验结果朝某一
个方向发生有规律的偏移。造成系统误差的原因有以下几种：
1. 度量工具的不正确或未经校正 2. 试验仪器及其读数器发生偏差或未经校正 3. 外界试验条件发生了很大的变化 4. 观测时间及顺序的影响 5. 试验人员操作及观测时的偏爱和习惯 6. 试验动物分组时发生的偏差等
资料的正确性
异常数据的校核与认定
错误数据的复查和更正
数据的审定与修证
✓ 异常数据观察数据中存在的极端值。
✓ 异常数据的判断和处理判断：数据是否有错误是否有与众不同的数据
✓ 处理：四分位数检验格拉布斯检验
2.资料的整理
频数分布：不同类型的观测值出现次数。
连续性资料的整理：组距式分组法
组距式分组法中的几个名词：
度，或将系统误差化为随机误差，以保证有足够
的准确度。
练习题
• I、参数是描述总体的特征数，某一特定总体的参数，其特点是
• A．完全可以通过一定方法测定的 • B．容易随观察者的角度不同而不同 • C．固定的变量 • D．不随人的意志改变
• 2、下列四种表述中不正确的一种是( )
• A．样本是总体中若干个体的随机集合
生物统计学
王建国
电话：18796419138 QQ： 290037120
第一章绪论
统计学的基本功能：
对资料进行整理和描述用局部数据来推断和估计全体研究对象的特征通过显著性检验来鉴定试验效应寻找因素间的关系
提供试验设计的一般原则和方法
统计学的特点
概率性——所有结论和结果都有一定的概率保证二元性——理论和实践的紧密结合，尤以实践为重归纳性——由特殊到一般、由局部到全体、由样本
一个样本内观测值即变量的个数，称为样本含量，用 n
表示。
n＞30为大样本，n≤30为小样本
有限总体的大小用 N 表示。
由于抽样往往是随机（random）的，因此抽样是随机抽样（random sampling 简称为抽样），随机抽样所得到的样本称为随机样本（random sample 简称为样本）

e商务文档

生物统计学

相关文档推荐：