当前位置:文档之家› 统计方法的基础知识

统计方法的基础知识

DOC版本 本讲座的宗旨 90年代以来,因为ISO-9000的认证要求,「SPC」这个名词就经常被提示;而且逐步被要求落实。近年来更因为科技产品在品质的要求上日趋严谨,其相关产业之供应者(制造商)不得不在部的「过程管理」上,加强对「SPC」的认识及实践。因此,这几年来「SPC」的课程不断开办,学习者络绎不绝。

过去开班授课的对象,大部份都是工程师或助理工程师级的学员,其学历大多是专科以上程度,对于课程容所引用的统计概念和公式,经过讲解后大部分学员都能理解(当然仍有部分学员搞不清楚)。可是最近几期开班发现,很多公司派来学习的人员,其虽然已经身为品管或制造单位的主管,但是却因从未接受基本的管理手法或统计品管的教育训练,在「SPC」讲解过程中,很难对其导入基础统计概念(观念转不过来)。

本着「有教无类」的教学理念,针对越来越多的「非专业」基础学员,总要设法协助他们顺利学成或至少能够达到某种程度的理解,以便回到工作岗位上达到工作需求。以这种想法为出发点而设计本课程,名为「基本统计概念与SPC手法」。顾名思义,本课程可以说是「SQC入门与SPC实战」的课程。

但是,如果扩大眼界,广义地评价本课程,其实也可以将其作为基层管理人员的「QC基础训练课程」。因为类似本课程的性质与容,从60年代开始推展的「QCC(品管圈)活动」就已经将其纳入教育训练的课程中,且已经实施四十年之久了。

编者积二十余年的工厂管理实务经验以及二十年的品管实务教学经验,深知有效的教导方法必须以工厂实务为依归。即使是刻板的计算公式或者是抽象的名词解释都能够以实务或举实例说明,保证易学、易懂而会应用。话虽如此,教学成功的另一个关键还是在学员本身的学习精神和态度。在此先与所有参与本讲座的学员共勉之! DOC版本

第一篇 统计方法的基础 壹、认识数据

一、数据的分类: 一般我们所收集的数据可以分为「计数值」与「计量值」两种。

1. 计数值 以计数的方式获取的数据,例如在生产线上随机抽检100个产品,发现有5个不良品,则可以计算当次的抽检不良率为5 %;又如品检员检查一匹布时,共检出3个缺点;某公司人事管理员统计一天的出勤率,总人数500人中有5个人缺勤,计算当天的出勤率只有99 %。

以上所出现的数字,100、5、5%、3、500、5、99%等皆为计数方式而得之数据,通称为计数值。

2. 计量值 用量具量测所获得的数据,例如物品的长度、重量、纯度、强度等数值。其不一定是整数,经常带有小数。像这样连续性的数值,称之为计量值。

二、数据的性质(通常针对计量值数据) 1. 数据的差异: DOC版本

一般我们所得到的数据为 测定值=真值+误差

误差是由于很多不同的原因所发生的: (1) 虽用同一测定器,同一测定者重复测定同一样本,也会发生重复误差。

(2) 如果用不同测定器测定同一样本时,会发生测定器间的误差。

(3) 如果用不同测定人员测定同一样本时,会发生测定者间的误差。 (4) 虽然同样一批物品,因所抽取样本的不同而发生抽样误差。 所以我们所获得的数据中,一定包括由于各种不同原因所引起的误差。

测定值=真值+同一测定器同一测定者因重复测定的误差 +测定器间的误差 +测定者间的误差 +抽样误差

(1)、(2)、(3)合起来总谓之测定误差,可简写为: 测定值=真值+测定误差+抽样误差 因为我们能力有限,所以不管如何严密的测定,都无法在完全同一的条件下重复测定,换言之,我们总是在不尽相同的条件下测定,所以希望得到完全带有再现性的测定值是不可能的。

我们应该承认以下的事实: (1) 我们不可能得到完全相同的数据,所以数据带有差异是当然的。 DOC版本

(2) 我们所获得数据,祇不过是从可以想象得到的无限次重复测定的数据群之中的几次样本而已。

2. 数据的可靠度

所谓的样本数据是否可信任,即在测定操作时是否有错误,或抽样时是否有异常原因发生,一般可分为精密度的可靠度与正确度的可靠度,无论如何,如要使数据可靠,一定要加强抽样,测定作业的管理。

3. 数据的精密度 用同一测定方法,测定同一样本,并反复作无限次的测定,或用同一抽样方法,抽取同一群体,并反复作无限次的抽样,一定会有变异发生,变异的宽度也正是数据分配的宽度,这种宽度的大小就是代表精密度,而此宽度越窄,表示其精密度越好。

4. 数据的准确度 用同一种测定方法,测定同一样本,并反复作无限次的测定,或用同一抽样方法抽取同一群体,并反复无限次的抽样,数据分配的平均值与真值之间多少一定会有差,这个差的大小就称作准确度,一般来讲,差越小表示准确度越好。

A 精密度 准确度 1 xxxxxxxxxxxxxxxx 1 劣 优

2 xxxxxxxx 2 优 劣

3 xxxxxxxxxxxx 3 劣 劣 DOC版本

4 xxxxxxxxx 4 优 优

如上图,若A值为真值,其它出现的数据的平均值愈接近真值,其准确度愈优;而数据变动宽度愈窄者,其精密度愈优。

贰、认识「母集团与样本」 工厂或研究室里,测定或试验样本,其目的通常并不是希望得到这些数据,主要是希望以此数据为根据,获知某种情报,并以此情报采取行动。但所要采取行动的对象,并非针对所抽取的样本本身,而是希望对于抽出样本的产品批或制程采取行动。

以样本数据为根据而希望处置的对象,谓之母集团(Population),为某种目的而由母集团抽取的一部份,谓之样本(Sample)。

例如:每天从制程抽取一定的制品测定而得到数据,由此数据绘制管制图,以管制制程是否发生异常现象时,此制程就是母集团,而为要测定数据,每天所抽取的一定数的制品就是样本,或从仓库中一大批的制品里,抽取数个检查其特性,以所得数据来判断此仓库中的制品批全体是否合格时,此仓库中的制品批全体就是母集团,而从此制品批所抽取的数个制品就是样本。研究母集团与样本间关系的学问,谓之数理统计学或推测统计学。

抽样 测定 有限母集团

群体批N n 数据

样本

处置 图2.1

无限母集团

制程 生产 群体批 N 抽样 测定

数据

处置

样本 n DOC版本

如上图2.1,是以群体批为母集团时,这群体的组成个数是有限的,所以我们称这种群体批为有限母集团(Finite Population)。例如前例的仓库中的制品批是有限母集团。相反的,如果以制程为对象时,如图2.2因自同一条件下可生产无限个制品,所以这种集团我们称之无限母集团(Infinite Population),如前例的管制图所要管制的制程是属于无限母集团。

参、母数及统计量 如果有100-200个数据时,把这数据整理而画出次数分配,就很容易看出制品的分配情形,但如果希望将此数据以数字表示时,就必须找出能代表分配位置的数字及能代表分配差异的数字,才能以数字看出此数据的情形,但一般最好是以其平均值表示分配位置及以变异来表示分配的差异较为方便。又如果祇有5个或10个数据时,虽画出次数分配,也看不出来,这种情形下,数据的性质祇好以其平均值及其差异的数量来表示。

表示母集团特性的定数,谓之母数(Parameter),现在一般所使用的母数有:

母平均─母集团的平均值,以符号μ表示。 母变异─母集团的变异,以符号σ²表示。 母标准差─母集团的标准差,以符号σ表示。 测定样本所得测定值,我们谓之统计量(Statistic)常使用的统计量一般有: 样本平均─样本的平均值,以符号 x表示。 (或平均) DOC版本

样本变异─样本的变异,以符号s²表示。 (或变异) 样本标准差─样本的标准差,以符号s表示。 (或标准差)

样本全距─样本的全距,以符号R表示。 为了简便,以表3.1表示如下: 母 数 统 计 量 名 称 符 号 名 称 符 号 分配位置的表示法 母平均 μ 样本平均 x 分配差异的表示法 母变异 母标准差 σ² σ=√σ² 样本变异 样本标准差 样本全距 s² s R

-表3.1- 肆、母数与统计量的计算

一、 分配位置的数字表示法 1.平均值x (Mean) ─将n个数据值加起来,除以数据数n。 即n个数据x 1,x 2 ,x 3,‥‥‥x n的平均值为

X = =

2.中值(Median) ─将数据依大小顺序排列,取其最中央的数值。

若数据有奇数个,如:

7支钉子的长度依序为12.66,12.62,12.57,12.56,12.48,12.42,12.37mm,则以排在中央的12.56为中值。

若数据有偶数个,如:

x 1+x 2 +x 3 +‥‥+x n n Σx i n

相关主题