当前位置:
文档之家› 数据资料的整理与特征数.ppt
数据资料的整理与特征数.ppt
上一张 下一张 主 页 退 出
样本容量:样本中所包含的个体数目叫 样本容量或大小(sample size),样本 容量常记为n。通常把n≤30的样本叫小 样本,n >30的样本叫大样本。 试验研究的目的:了解总体,然而能观 测到的却是样本,通过样本来推断总体 是统计分析的基本特点。
上一张 下一张 主 页 退 出
大的可靠性 出
1.2 参数与统计量
为了表示总体和样本的数量特征,需要计算
特征数。
参数:由总体计算的特征数叫参数
(parameter);常用希腊字母表示参数,例如 用μ表示总体平均数,用σ表示总体标准差;
统计量:由样本计算的特征数叫统计量
1.3 准确性与精确性
准确性(accuracy)也叫准确度,指观 测值与其真值的接近程度。设某一试验指标 或性状的真值为μ,观测值为 x,若 x与μ
相差的绝对值|x-μ|越小, 则观测值x的
准确性越高; 反之则低。
上一张 下一张 主 页 退 出
精确性(precision)也叫精确度,指同一试验 指标或性状的重复观测值彼此接近的程度。若观测
三种不同类型的资料相互间是有区别的, 但有时可根据研究的目的和统计方法的要求将 一种类型资料转化成另一种类型的资料。
例如,酸奶中的乳杆菌总数得到的资料属 于计数资料,根据化验的目的,可按乳杆菌总 数正常或不正常分为两组,清点各组的次数, 计数资料就转化为质量性状次数资料;如果按 乳杆菌总数过高、正常、过低分为三组 ,清 点各组次数 ,就转化成了半定量资料 。
(staistic)。常用拉丁字母表示统计量,例如用 x
表 示样本平均数,用s表示样本标准差,用R表
示极差。
上一张 下一张 主 页 退 出
总体
为了了解总体分布、特征
抽样
样本
参数 μ σ σ2
构造
推断、估计 统计量
平均数
x
标准差
s
方差
s2
极差
R
总体参数由相应的统计量来估计,例如
用 x 估计μ,用S估计σ等。
2.2.1 统计次数法
在一定的总体或样本中,根据某一质量性 状的类别统计其次数,以次数作为质量性状的 数据。例如,苹果中全红果个数与半红果个数。
由质量性状数量化而得来的资料又叫 次数 资料。
2.2.2评分法
对某一质量性状 , 因其类别不同,分别给 予评分。例如,分析面包的质量,可以按照国际 面包评分细则进行打分,综合评价面包质量。新 产品开发中的评价打分等等。
上一张下一张主 页退 出
2.3 半定量(等级)资料
半定量或等级资料(semi-quantitative or ranked data)是指将观察单位按所考察 的性状或指标的等级顺序分组,然后清点各组 观察单位的次数而得的资料。这类资料既有次 数资料的特点,又有程度或量的不同。如某种 果实的褐变程度是视果实变色面积将其分组, 然后统计各级别果数。
值彼此接近,即任意二个观测值xi 、xj 相差的绝对 值|xi -xj |越小,则观测值精确性越高;反之则低。
准确性、精确性的意义见图2-1。
图2-1 准确性与精确性的关系示意图 上一张 下一张 主 页 退 出
2 统计资料的分类
正确地进行试验数据资料的分类是统计 资料整理的前提。在调查或试验中,由观察、 测量所得的数据资料按其性质的不同,一般 可以分为数量性状资料、 质量性状资料和 半定量(等级)资料三大类。
上一张 下一张 主 页 退 出
2.1.1 计量资料
用测量方式获得的数量性状资料,即用 度、量、衡等计量工具直接测定获得的数 量性状资料。其数据是用长度、容积、重 量等来表示。这种资料的各个观测值不一 定是整数,两个相邻的整数间可以有带小 数的任何数值出现,其小数位数的多少由 度量工具的精度而定 , 它们之间的变 异是连续性的。因此,计量资料也称为连 续性变异资料。
为了能可靠地从样本来推断总体,要求 样本具有一定的含量和代表性。
如何获取有代表性的样本?采用随机抽 取。
所谓随机抽取(random sampling) 是指总体中的每一个个体都有同等的机会被 抽取到样本中。
样本毕竟只是总体的一部分,尽管样本
具有一定的含量也具有代表性,通过样本来
推断总体也不可能是百分之百的正确。有很
2.2 质量性状资料
质量性状(qualitative character)是指能 观察到而不能直接测量的,只能用文字来描述其 特征的性状,如食品颜色、 风味等等。这类性状 本身不能直接用数值表示,要获得这类性状的数 据资料,须对其观察结果作数量化处理,其方法 有以下两种:
上一张 下一张 主 页 退 出
上一张 下一张 主 页 退 出
3 数据资料的整理
3.1
未整理的资料为原始资料,是零星的、孤立的和杂乱无章,无规律可 循,通过科学的整理和分析,可发现其规律性,揭示事物内在本质。
数据资料的检查与核对
目的:在于确保原始资料的完整性和正确性。
上一张 下一张 主 页 退 出
2.1.2 计数资料
指用计数方式获得的数量性状资 料。在这类资料中,它的各个观察值 只能以整数表示,在两个相邻整数间 不得有任何带小数的数值出现。这些 观察值只能以整数来表示,各观察值 是不连续的,因此该类资料也称为不 连续性变异资料或间断性变异资料。
上一张 下一张 主 页 退 出
2 数据资料的整理与特征数
上一张 下一张 主 页 退 出
1 数理统计中的常用术语
1.1 总体与样本
总体:根据研究目的确定的研究对象的全体称为总体 (population); 个体:总体中的每一个研究单位称为个体 (individual); 样本: 依据一定方法由总体中抽取部分个体所组成的 集合称为样本(sample); 有限总体:含有有限个个体的总体称为有限总体; 无限总体:包含有无限多个个体的总体称为无限总体;
上一张 下一张 主 页 退 出
2.1 数量性状资料
数量性状(quantitative character)是指能 够以测量、计量或计数的方式表示其特征的性状 。 观察测定数量性状而获得的数据就是数量性状资料
数量性状资料的获得有测量和计数两种方式 , 因而数量性状资料 又分为计量资料和计数资料两种。