当前位置:文档之家› MINITAB应用置信区间与假设检验(ppt 107页)

MINITAB应用置信区间与假设检验(ppt 107页)


2、成对(配对)T检验
2、成对(配对)T检验
统计 > 基本统计量 > 配对 t
• 配对 T 检验和置信区间 • * 注 * 无法使用摘要数据生成图形。(为什么?)
平均值 N 平均值 标准差 标准误差分 6 0.300 0.335 0.137 平均差的 95% 置信区间: (-0.052, 0.652)
通过对发生率之间差值以及平均发生次数之间差值执行假设检验 并 为之计算置信区间 ,对来自 Poisson 过程的两个样本进行比较。
案例: 公司 A 和公司 B 生产电视机,在过去十年中,它们对有缺陷的屏幕
的单元数进行了计数。公司 A 每个季度(3 个月)对缺陷单元进行一次 计数,而公司 B 则每半年对缺陷单元数进行一次计数。您管理着一家电 子零售店,您想最大限度降低库存电视机的缺陷数。为了确定应库存哪 家公司的产品,您进行了一项双样本 Poisson 率检验,以确定哪家公司 的月缺陷率最低。
2)均值单边Z值检验和P检验(下侧假设检验拒绝域)
3、总体均值单边检验 3)大样品情况(双侧)
检验是否符合规格中心值
如加工零件规格值为5,先抽测30个样本,看中心值是 否偏离规格中心值。
本案例中,H0:μ=5, Ha:μ≠5
如果样品表明不能拒绝H0,就不能判定实际中心值偏移。 无需采取纠偏行动。
一产能提高改善项目,设定了二种作业方法,想了解二种方法 工作效率是否有差异。 H0:μ1=μ2, Ha: μ1≠μ2
二种抽样方法: 1)独立样本方案.抽出6名工人用方法一加工,另抽6名工人用方法2加 工,比较二种方法的效率。(双样本T检验) 2)配对样本方案。出6名工人用方法一加工,再用方法2加工,比较二种 方法的效率。(配对样本T检验)
1、双样品T值检验和P检验
电池的新旧配方放电恢复案例 型配方是否比旧配方有改善?
从图形你发现什么?
对话窗口:
双样本 T 检验和置信区间: 放电恢复, 配方 放电恢复 双样本 T
配方
平均值 N 平均值 标准差 标准误差值 = mu (旧) - mu (新)
旧 20 5.987 0.834 0.19 新 20 4.813 0.589 0.13
1、建立假设 P1、P2分别表示甲乙两种品牌的顾客满意率 H0: P1-P2≤0.05 H1:P1-P2>0.05
2 双比例检验(2-P) 2)、检验
2 双比例检验(2-P)
四、泊松假设检验
Poisson 过程描述某一事件在给定的时间、面积、体积等范 围内的出现次数。 • 例如, • 客户服务中心每天接听的电话数 • 一定长度导线的缺陷数 案例:瓷砖供应商连续统计100批瓷砖缺点数,期望缺点数 少于30,数据见《minitab数据库》
1)均值单边Z值检验和P检验(上侧假设检验拒绝域)
3、总体均值单边检验
2)大样品情况(下侧假设检验拒绝域)
检验某项声明的有效性 如手提电脑电池厂家声明:他的SAK电池使用寿命至少 是3年 。通过选取样品来检验是否符合其声明。 本案例中,H0:μ≥3年, Ha:μ<3年 如果样品表明不能拒绝H0,就不能对供方声明提出异议。 如果Ha:μ<3是真,可以拒绝H0,统计数据表明供方声明 有问题。 先定义α风险是5%, 既α=0.05,进行假设检验时犯 第一类错误的最大概率是5% , α也叫显著性水平。 抽30个电池样品得出其平均寿命分布。
95% 变量 X N 样本 p 上限 精确 P 值 比率 1 1 1.00 0000 * 1.000
Z检验结果:
2 双比例检验(2-P)
同种产品有甲、乙两种品牌。随机抽取800位及600位各自购 买了甲乙两种品牌顾客,其中甲品牌有340位顾客对其产品质 量表示满意,乙品牌有180位顾客对其产品质量表示满意。在 α=0.05下,检验甲种品牌的顾客满意率比乙种品牌的顾客满 意率高5%以上。
双样本 Poisson 率 : 缺陷 A电视, 缺陷 B电视 的检验和置信 区间观测值的
五、多比例和卡方检验
当多个Y和多个X(Y和X)都是属性数据时,可使用MINITAB统计 > 表格 > 下各个统计方法:
单变量计数:显示包括每个指定的变量的计数、累积计数、百分比 和累积百分比 的表。 交叉分组表和卡方: 显示包含计数数据的单因子、双因子和多因子表。卡方选项检验 双因子分类中各特征之间的相关性。使用此过程检验对某一变量分类项目或主题的概率 是否取决于其他变量的分类。要使用此过程,您的数据必须为原始形式或频率 形式。 卡方拟合优度检验(单变量):检验数据中是否有某些比率 服从多项式分布。 数据必须为原始形式或汇总形式。 卡方检验(工作表中的双向表):检验双因子分类中各特征之间的相关性。 数据必须为列联表形式。 描述性统计量:显示包含类别变量数据和关联变量数据的描述性统计量 摘要的单因子、双因子和多因子表。
MINITAB应用 置信区间与假设检验
如何估和筛选因子(2)
目录
一、图形直观评估和筛选 二、QC基本工具 三、数据假设检验
(一)单样本假设检验和置信区间
项目案例:
A公司六西格玛小组设计出一新的铅酸电池,在以下放 电条件下,放电时间不低于5min 放电功率:435w 终止电压:1.60v/cell 放电温度:25℃ 现从一批试作电池的中得到30个放电时间数据。需要确定新 产品是否达到要求? 此问题是用样品均值推断总体均值,并作假设检验来确定是 否拒绝总体参数的解释。
统计 > 基本统计量 > 单样本 Poisson 率
为单样本 Poisson 过程中事件的发生率和平均发生次数 计算置信区间 ,并进行发生率等于指定值的假设检验 。
对话框输出
单样本 Poisson 率 : 瓷砖缺点数 的检验和置信区间 比率检验 = 30 与比率 < 30
统计 > 基本统计量 > 双样本 Poisson 率
现从一批试作三极管得到30个漏电流数据。需要确 定新技术参数是否达到要求? 此问题是用样品均值推断总体均值,并作假设检验 来确定是否拒绝总体参数的解释。
(二)、双样本均值置信区间和假设检验
1、双样本 t 检验 比较二组样本如:二台设备、二个操作者、 二个材料、二种方法、二条线等等 总体均值 之间关系,样本没有关系。 2、配对t 检验 如果二组样本不是独立的,有关联的,如同一检验员培训前 后测量值,同一组工人先后用不同的方法生产。每个样品个 体提供一对数据值,因而叫配对样品。
1、原假设和备择假设的建立
1)研究中的假设
原假设H0和备择假设Ha是完全相反的假设。 本案例中,H0:μ≤5, Ha:μ>5 如果样品表明不能拒绝H0,就不能得到新的电池平 均放电时间大于5分钟的结论,需要进一步研究。 如果Ha:μ>5是真,可以拒绝H0,统计数据表明新 电池平均放电时间大于5分钟,可以投产。
3)双边Z值检验和P检验
统计 > 基本统计量 > 单样本 Z
统计 > 基本统计量 > 单样本 Z输出结果
图形,注意95%区间范围
B 小样品T值检验和P检验
统计 > 基本统计量 > 单样本 t 前述电池寿命试验。
是否超过三年?
无法拒绝原假设
项目案例:
A公司六西格玛小组改善导体三极管漏电流,目 标是小于5.0X10-15A。经过小组努力后找到了关键原 因并对相关参数进行优化。
1、单变量计数
• 统计 > 表格 > 单变量计数 • 用于显示每个指定变量的计数、累积计数、百分比和累积百分比。 如:统计一周的缺点严重度
卡方拟合优度检验(单变量)
卡方检验 • 一个假设检验族,用于在原假设下将数据的实测分布与其预期分布进行比较。 卡方检验有多种,可帮助您: • 检验样本与某个理论分布的拟合程度。例如,正 6 面骰子服从均匀分布,因 为所有 6 个结果具有相等的概率。通过多次掷骰子并使用卡方拟合优度检验 来确定结果是否服从均匀分布,可以检验骰子是否是正 6 面形的。在此情况 下,卡方统计量会将计数的实测分布不同于假设分布的程度进行量化。 • 检验统计模型是否与数据相拟合。例如,Logistic 回归使用卡方拟合优度检 验来确定它能否充分地为样本数据建模。 • 检验类别变量之间的独立性。例如,主管三个客户支持呼叫中心的经理想要 知道客户问题的成功解决(是或否)是否取决于接听呼叫的呼叫中心。该经 理将每个呼叫中心的成功和不成功的解决计数记录在一个表中,并执行数据 独立性的卡方检验。在此情况下,卡方统计量会将计数的实测分布不同于预 期分布(假设呼叫中心与成功解决之间不存在关系时的预期分布)的程度进 行量化。
人们往往把目的作为被择假设,通过拒绝原假设达到目的
2、第一类错误和第二类错误
3、总体均值单边检验
A 大样品情况
A公司六西格玛小组设计出一新的铅酸电池,在以下放 电条件下,放电时间不低于5min 放电功率:435w 终止电压:1.60v/cell 放电温度:25℃ 现从一批试作电池的中得到30个放电时间数据。需要确定新 产品是否达到要求? 此问题是用样品均值推断总体均值,并作假设检验来确定是 否拒绝总体参数的解释。
差值估计: 1.175 差值的 95% 置信下限: 0.790 差值 = 0 (与 >) 的 T 检验: T 值 = 5.14 P 值 = 0.000 自由度 = 38 两者都使用合并标准差 = 0.7221
2、成对(配对)T检验
如果二组样本不是独立的,有关联的,如同一检验员培训前后 测量值,同一组工人先后用不同的方法生产。每个样品个体提 供一对数据值,因而叫配对样品。
实际工作的Χ2检验
一公司年度考评制度规定各等级人数比例 是:A级—10% B级—30% C级—40% D级—15% E级—5% 现抽出120个样品,其中有18个A,30个B,40 个C,22个D,10个E。 取α=0.05 检验实际评价等级是否显著偏 离制度规定。
相关主题