当前位置：文档之家› 第四章抽样误差与假设检验

第四章抽样误差与假设检验

4. 应事先确定α。选α＝0.05只是一种习惯，而
不是绝对的标准。
3rew
演讲完毕，谢谢听讲!
再见，see you again
PPT文档演模板
2020/11/28
第四章抽样误差与假设检验
• 样本均数的标准差。
•它反映了来自同一总体的样本均数之间的离散程度以及样本均数和总体均数的差异程度,即均数的抽样误差的大小。
•统计上用标准误来衡量抽样误差的大小！
PPT文档演模板
第四章抽样误差与假设检验
•由于在实际工作中，总体标准差σ往往未知，而是用样本标准差S来代替σ，故只能求得样本均数标准误的估计值S X ，其计算公式为：
PPT文档演模板
•估计
第四章抽样误差与假设检验
•例 4.1 某市随机抽查成年男子140人，得红细胞均数4.77×1012/L，标准差 0.38×1012/L，计算其标准误。
PPT文档演模板
第四章抽样误差与假设检验
•第二节总体均数的估计
•一、可信区间的概念
•1.统计推断（statistical inference）在总体中随机抽取一定数量观察单位作为样本进行抽样研究，然后由样本信息推断总体特征，这一过程称为统计推断。
• 1899年作为一名酿酒师进入爱尔兰的都柏林一家啤酒厂工作，在那里他涉及到有关酿造过程的数据处理问题。
• 由于酿酒厂的规定禁止戈塞特发表关于酿酒过程变化性的研究成果，因此戈塞特不得不于1908年，首次以“学生” (Student)为笔名，在《生物计量学》杂志上发表了“平均数的概率误差”。Gosset在文章中使用Z统计量来检验常态分配母群的平均数。由于这篇文章提供了“学生t检验”的基础，为此，许多统计学家把1908年看作是统计推断理论发展史上的里程碑。
•随机变量X •N（m，s2）
•u变换
•标准正态分布 •N（0，12）
•当总体均数与标准差未知时
•均数
•标准正态分布 •N（0，12）
•在实际工作中，行变换，即
往往未知，常用
代替进
•
•不服从标准正态分布！
•而服从自由度υ=n-1的t分布
• f(t)
•0.3
• =∞(标准正态曲线) • =5 • =1
•统计推断
PPT文档演模板
•参数估计 •假设检验
•点估计 •区间估计（可信区间）
第四章抽样误差与假设检验
•2.参数估计（parameter estimation）是指由样本统计量估计总体参数，是统计推断的一个重要内容。
•（1）点估计（point estimation） •用样本统计量直接作为总体参数的估计值。
•μ=155.4cm •σ=5.3cm
PPT文档演模板
•XS
• 1. 156.7
•
5.16
一
2. 158.1 5.21
百
个
3. 155.6 5.32
样
4.
本
5. 99. 154.6 5.15
第四章抽样误差与假设检验
•抽样误差(smpling error)
• 这种由抽样造成的样本统计量与总体参数之间的
•该地成年男子红细胞总体均数的95%可信区间为4.71×1012/L～ 4.83×1012/L
PPT文档演模板
第四章抽样误差与假设检验
•第三节假设检验的意义和步骤
•一、假设检验的基本思想 “反证法”的思想
先根据研究目的建立假设，从H0假设出发，先假设它是正确的，再分析样本提供的信息是否与H0有较大矛盾，即是否支持H0，若样本信息不支持H0，便拒绝之并接受H1，否则不拒绝H0 。
•3.确定概率P值和作出统计推断
PPT文档演模板
第四章抽样误差与假设检验
•样本统计量值的概率P
•样本统计量值的概率P
•用P值与检验水准α进行比较，根据比较结果作出统计推断。
•检验水准α确定的P值
•检验水准α确定的P值
•样本统计量值的概率P
•样本统计量值的概率P
•检验水准α 确定的 P值
•P≤ α，则拒绝H0，接受H1
•P> α，则接受H0，拒绝H1
•关于假设检验的几个观点
1. 对于H0只能说拒绝与不拒绝，而对H1只能说接受。
2. P≤α，则拒绝H0 ，接受H1 ，差异有统计学意
义，可认为……不同或不等。
3. P>α，则不拒绝H0 ，差异无统计学意义，尚
不能认为……不同或不等。
差异成为抽样误差.
•总体 • 随机抽样
•参数
•
•样本
•统计量 •
•只要有个体变异和随机抽样研究，抽样误差就是不可避免的。
•中心极限定理
•若从正态总体N(μ， σ 2）中，反复多次随机抽取样本含量固定为n的样本，那么这些样本均数也服从正态分布。样本均数的总体均数仍为μ，样本均数的标准差为 ,其计算公式为：
•μ=155.4cm •身高（cm）
•3.可信区间有两个要素：
•（1）准确度（accuracy）可信度的大小，即可信区间包容μ的概率大小（1-α）。 •（2）精密度（precision）反映在区间的长度，区间长度越小精密度越高。 •一般情况下，95%的可信区间更为常用。
•在可信度确定的情况下，增加样本量，可减少区间长度，提高精密度。
PPT文档演模板
第四章抽样误差与假设检验
•二、总体均数可信区间的计算 •t分布是t检验的基础，亦称 student t检验，是计量
资料中最常用的假设检验方法。
•戈塞特
•(William Sealey Gosset)
• 英国著名统计学家。出生
于英国肯特郡坎特伯雷市，求学于曼彻斯特学院和牛津大学，主要学习化学和数学。
• 与μ0之间的差异（不相等），有两种可能： •1、 μ= μ0，仅因为用去估计μ时存在抽样误差，所以导致了与μ0之间的差异。 •2、 μ与μ0本身就不相等，所以导致了与μ之间的差异。
•假设检验的基本原理:
•
•
•
•两均
等•
数两
• •
率不
抽样误差所致（来自同一总体）
P>0.05
? 假设检验回答
•0.2
•0.1
•-4 •-3 •-2 •-1 •0 •1 •2 •3 •4
•t分布
•t分布的特征：
•1、以0为中心，左右对称的单峰分布。
•2、t分布曲线是一簇曲线，其形态变化与自由度ν的大小有关系（ ν =n-1）。
•自由度越小，t分布的峰越低，而两侧尾部翘得越高；
•自由度逐渐增大时，t分布逐渐逼近标准正态分布，当自由度为无穷大时， t分布就是标准正态分布。
第四章抽样误差与假设检验
•例4.2 某医生测得25名动脉粥样硬化患者血浆纤维蛋白原含量的均数为3.32g/L，标准差为 0.57g/L，试计算该种病人血浆纤维蛋白原含量总体均数的95%可信区间。
•该种病人血浆纤维蛋白原含量总体均数的95%可信区间为3.09g/L～ 3.56g/L
•例4.3 试计算例4.1中该地成年男子红细胞总体均数的95%可信区间。
按u分布
按u分布
PPT文档演模板
第四章抽样误差与假设检验
•（一）σ已知
•u变换公式：
•95 % •2.5%
•2.5%
•m-1.96s •m •m+1.96s
•（二）σ未知 •1.n较小（n<50)
•- •0 •t t
PPT文档演模板
第四章抽样误差与假设检验
•2.n较大（n>50)
PPT文档演模板
PPT文档演模板
第四章抽样误差与假设检验
•单、双侧检验
•H1： μ≠μ0，双侧，μ<μ0与μ>μ0都有可能 •H1： μ>μ0，单侧 •H1： μ<μ0，单侧
•例如：要比较经常参加体育锻炼的中学男生心率是否低于一般中学男生的心率，就属于单侧检验。
•单双侧问题要由专业知识确定
•2.选择检验方法和计算统计量 •根据资料的类型和分析目的选择适当的检验方法，并根据选择的方法计算相应的统计量。
本身存在差别（来自不同总体）
P<0.05
•二、假设检验的基本步骤
•1.建立假设检验和确定检验水准
•H0（无效假设）：μ=μ0
•H1（备择假设）：••μμμ<≠>μμμ00（0(单双侧侧检检验验）)
•α=0.05
•检验水准：在实际工作中一般取 0.05。它确定了小概率事件的标准，即规定了概率不超过α就是小概率事件。
•（2）区间估计（interval estimation）又称可信区间（置信区间，CI） •按预先给定的概率，计算出一个区间，使它能够包含未知的总体均数。
•进行100次抽样，每次样本量为n=30，利用样本均数和标准差估计总体均数范围。
•总体均数的95%可信区间，平均有95个可信区间包括了总体均数μ，只有5个可信区间不包括μ，即估计错误。
PPT文档演模板
第四章抽样误差与假设检验
•原始 •总体
•μ
•SAMPLE 1：x11 x12 x13 x14...x1n •SAMPLE 2：x21 x22 x23 x24...x2n
•SAMPLE k：xk1 xk2 xk3 xk4...xkn
•k个样本均数的频数分布图
•标准误(standard error,SE)
•例4.4 以往通过大规模调查已知某地新生儿出生体重为3.30kg. 从该地难产儿中随机抽取35名新生儿作为研究样本，平均出生体重为3.42kg, 标准差为0.40kg。
•问该地难产儿出生体重是否与一般新生儿体重不同？

e商务文档

第四章抽样误差与假设检验

相关文档推荐：

e商务文档

第四章 抽样误差与假设检验

相关文档推荐：

第四章抽样误差与假设检验