生物统计学
数据资料。 (3)具体性:已经实现的事实的记载。
• 主要内容: 1)数据的审核与修订 2)数据的汇总与分组 3)基本统计特征计算 4)用图表展示结果
1.资料的分类
什么是资料(data)? 资料有哪些种类?
连续性资料(comtinuous data)? 离散性(间断性)资料(discrete data)? 离散性资料又分成哪两类?
计数资料(counting data) 分类资料(categorical data)
1 资料的分类
特点:数字性、大量性、具体性 类型:
连续性资料:一定范围内可取任何实数值的 数据资料。如:身高 离散性资料:一定范围内只取有限值的数据。
计数资料:用计数的方式得到的数据资料, 如:人数,鸡蛋数
分类资料:以类别作为分类对象,如:性别
(variate)。
变量在某一个体具体表现出来的数值又称为变数或 称观测值(observed value)、数据(data)、 资料(data)
变量是和常量(constant)相对应的一个概念
参数和统计量 用来描述总体特征的数值称为参数(parameter) 由样本观测值计算得到的描述样本特征的数值称为
第二章 资料整理
1 资料的分类 2 数据的频率分布 3 数据的表示方法 4 集中趋势的度量计资料:指反映事物、现象或过程的数据资料。 包括原始资料和次级资料。
特点:
(1)数字性:数字形式或者可以转换为数字形式。 (2)大量性:大量相像或对同类相像观察所取得的
总体与样本的关系:样本必须来自于总体 样本必须能代表总体
如: 一叶知秋
管窥蠡测 尝鼎一脔
总体与样本关系不好的例子:
一叶障目 瞎子摸象
变异和变量
在实践中,无论是总体还是样本,无论是调查还是 试验,所得到的数值都是有差别的,这种差别在 统计学中称为统计数据的变异(variation)
具有变异性质的数值在生物统计学中就称为变量
机误差。 在不发生歧义的情况下,随机误差简称为误差 如果观测次数足够多的话,随机误差有统计学上的意义
每一次观测所产生的随机误差都是独 立发生的,且服从一定的规律 通过各种手段可以把随机误差有效地缩小到最低的程度 随机误差是进行统计假设检验的基础 降低随机误差,可以: 1 提高试验的精确性 2 可以更好地区别误差效应(表面效应)和处理效应,
总体(population):具有相同性质的所有观测 值所组成的集合(set)
在实际工作中只能对总体中具有代表性的一小部分 进行研究。被研究的这一小部分观测值(子集 subset)必须来自于这一总体,并具有很好的 代表性。这样的一批观测值的子集就称为样本 (sample)
从总体中得到样本的过程称为抽样(sampling)
• 分类资料
公称尺度:不同类别之间没有等级之分。 如:性别公、母,正常、不正常。
等级尺度:不同类别之间有内在的等级之分。 如:成绩的优、良、中。
分类资料的相对数表示(%):
受精率 孵化率 出苗率 有效率 合格率
出栏率 上市率 情期受胎率 死亡率
资料的采集与核对
资料的采集: 调查 试验
记录
资料的检查与核对: 资料的完整性
• B.统计上所指的样本均是指随机样本
• C.保证总体中的每个个体均有相等的概率被 抽取作为样本的抽样叫随机抽样,抽得的样本 叫随机样本。
• D.通过抽样调查获得的样本是随机样本,用 试验方法获得的数据不是随机样本
• 3、研究某肉用仔鸡56天体重,因为该 肉用仔鸡是一个极大的群体,其数量是 一个天文数字,该总体属于( )。
从畜牧科研实践中所得到的数据资料 具有变异性、随机性和复杂性 。 学习畜牧统计学的目的就是要使用统计学的原理和方法
来定量地处理和分析生物数据的这些变异性、不确定 性和复杂性,从而得出最令人信服的结论,以阐明事 物发展的规律 。 畜牧统计学是畜牧学科中的一个重要工具。 它能帮助畜牧工作者发现隐藏在纷繁复杂的表面现象下 面的客观规律 。
如何学习畜牧统计学?
首先,确立统计学的思维方式,学会用统计学的思想 来武装自己的头脑,用统计学的思考方式来观察世 界,观察周围的事物。
其次,在畜牧科研、技术推广等方面要用好用活统计 学,除了学好统计学,掌握统计学的基本原理、计 算公式、数学概念和含义、具有一定的电脑知识和 操作技能外,还必须有坚固、扎实的畜牧学专业方 面的知识,丰富的畜牧实践。
10、调查江苏省2004年全省生猪生产情况时,如果以 断奶休重为指标,则该总体是( )
A.无限总体 B.有限总体 C.既不是有限总体又不是无限总体 D.既是有限总体又是无限总休
14、描述样本的特征数为统计量,统计量 一般有两个,即平均数和变异数,除了地 位特征数外,下述( )是常用的统计量。
A.中位数,算术平均数,几何平均数,方差和 标准差
以消灭 。
准确度和精确度
准确度和精确度和两类误差密切相关。 准确度(accuracy):指观测值与真值接近的
程度。 当发生系统误差时,观测值都会有规律地向某一
个方向偏离真值,因而降低了试验的准确度
精确度(precise)
指在同一处理条件下,同一批观测值间相互接近 的程度。
当随机误差较大时,数据较离散,精确度较低 。 准确度是比精确度更重要的一个概念 在任何时候,都应当将系统误差降至零或最小程
全距——极差(range) 组距(class interval)
组限(class limit)组中值 组下限 组上限
次数分布表
次数分布图
离散性资料的频数分布 70头母羊窝产仔数
7 8 11 14 10 12 11 10 10 7 10 12 11 10 10 11 9 12 8 10 10 9 11 12 10 12 9 9 11 10 11 11 13 11 14 13 10 11 13 11 13 10 10 9 11 11 8 9 9 11 10 7 10 13 12 12 13 10 11 9 12 10 10 11 8 10 8 10 11 13
最后,用畜牧统计学处理和分析每一批资料、每一 批数据,都必须有充分的生物学意义和畜牧学意 义,而所作的试验也必须有生物学科的理论意义 和实践意义。
因此,畜牧统计学的学习,统计学方法的应用不能 孤立地、单独地进行,它必须紧密结合畜牧学科 的实践,以取得具有专业意义和指导意义的结果。
常用统计术语
总体和样本
统计量(statistic)
参数用希腊字母表示 ,如μ、σ2、β、ρ 统计量用英文字母表示 ,如x、s2、b、r
参数一般为一常量,需通过样本的统计量来进行估 计(estimation)
从同一总体中抽取不同的样本所计算得到的同一性 质的统计量是不会相同的,因此统计量是变量
这些统计量都可以用来无偏(unbias)地估计相 应的参数
使得试验结果更正确。 3 对试验处理间的差异所作出的评定更准确、更可靠 。
错误(mistake)
由于工作人员的粗心大意或不负责任(如仪器使用 不当,错读数据,记录不准,任意涂改,凭空杜 撰等)所产生的测定值与真值的偏差,称为错误
错误不是统计学的研究内容 在试验和调查中,错误应当、必须,同时也可以加
B.众数,算术平均数,几何平均数,方差和标 准差
C. 极差,算术平均数,几何平均数,方差和标 准差
D.算术平均数,几何平均数,方差和标准差
第二章 资料整理
原始数据:
大量的、“杂乱无章” 不能直接用于统计分析,必须经过统 整理和加工。
第二章 资料整理
资料整理的主要内容
(1)审核与订正:人为错误、小数点等 (2)分组与汇总:内部结构、类型和特征 (3)计 算各种综合数字特征:如,n、平均数、标准差 (4)统计表或统计图:显示资料的基本特征和内在规律
系统误差(systematic error) 指由于某些特定的非试验条件所造成的使试验结果朝某一
个方向发生有规律的偏移。 造成系统误差的原因有以下几种:
1. 度量工具的不正确或未经校正 2. 试验仪器及其读数器发生偏差或未经校正 3. 外界试验条件发生了很大的变化 4. 观测时间及顺序的影响 5. 试验人员操作及观测时的偏爱和习惯 6. 试验动物分组时发生的偏差等
资料的正确性
异常数据的校核与认定
错误数据的复查和更正
数据的审定与修证
✓ 异常数据 观察数据中存在的极端值。
✓ 异常数据的判断和处理 判断: 数据是否有错误 是否有与众不同的数据
✓ 处理: 四分位数检验 格拉布斯检验
2.资料的整理
频数分布:不同类型的观测值出现次数。
连续性资料的整理:组距式分组法
组距式分组法中的几个名词:
度,或将系统误差化为随机误差,以保证有足够
的准确度 。
练习题
• I、参数是描述总体的特征数,某一特定总体的 参数,其特点是
• A.完全可以通过一定方法测定的 • B.容易随观察者的角度不同而不同 • C.固定的变量 • D.不随人的意志改变
• 2、下列四种表述中不正确的一种是( )
• A.样本是总体中若干个体的随机集合
生物统计学
王建国
电话:18796419138 QQ: 290037120
第一章 绪论
统计学的基本功能:
对资料进行整理和描述 用局部数据来推断和估计全体研究对象的特征 通过显著性检验来鉴定试验效应 寻找因素间的关系
提供试验设计的一般原则和方法
统计学的特点
概率性——所有结论和结果都有一定的概率保证 二元性——理论和实践的紧密结合,尤以实践为重 归纳性——由特殊到一般、由局部到全体、由样本
一个样本内观测值即变量的个数,称为样本含量,用 n
表示。
n>30为大样本,n≤30为小样本
有限总体的大小用 N 表示。
由于抽样往往是随机(random)的,因此抽样是随机 抽样(random sampling 简称为抽样),随机抽 样所得到的样本称为随机样本(random sample 简称为样本)