当前位置:
文档之家› 如何用Excel做统计学分析
如何用Excel做统计学分析
❖ 应用条件:①各样本须是相互独立的随机样本;②各样
本来自正态分布总体;③各总体方差相等,即方差齐。
❖ 用途:①两个或多个样本均数间的比较;②分析两个或多
个因素间的交互作用;③回归方程的线性假设检验;④多元 线性回归分析中偏回归系数的假设检验;⑤两样本的方差齐 性检验等。
Excel中的方差分析
单因素方差分析(one-way ANOVA) 可重复双因素方差分析 无重复双因素方差分析
方差分析的步骤
❖ 1.建立零假设H0:
样本均数都相同即μ1=μ2=μ3=…=μm=μ,m个样本有共 同的方差 。则m个样本来自具有共同的方差 和相同的均数u 的总体。
❖ 2.选择方差分析方式及计算公式 ❖ 3.根据P值得出结论:
(MS间>>MS内),F>F0.05(df间,df内), p<0.05,拒绝零假 设, 说明样本来自不同的正态总体,说明处理造成均值的差 异有统计意义
号N(μ, σ )表示均数为μ ,标准差为σ的正态分布。
置信区间
❖ 可信区间
:按预先给定的概率确定的包含未知总体参数的可能 范围。该范围称为总体参数的可信区间(confidence interval,CI)。 它的确切含义是:可信区间包含总体 参数的可能性是1- α,而不是总体参数落在该范围的可能性 为1- α。当a = 0.05时,称为95%可信区间,记作95%CI。 当a = 0.01时,称为99%可信区间,记作99%CI。
若两总体方差相等,则直接用t检验,若不等, 可采用t'检验或变量变换或秩和检验等方法。
❖ T检验
T检验
对两样本均数(mean)差别的显著性进行检验
用于小样本(样本容量小于30)
T检验分类
❖ 单样本t检验:是用样本均数代表的未知总体均数和已
知总体均数进行比较。
❖ 配对t检验:是采用配对设计方法观察以下情形,1,两
三.一元线性回归
回归关系的显著性检验---F检验
1.零假设: 2.F值计算:
3.P值及结论: 判断线性回归方程是否显著,是否有
意义。
决定系数(r2): 表示回归方差估测可靠程度的高低
相关系数(r): 表示y与x直线相关的密切程度
回归系数的t检验
❖ 1. 零假设H0:β=0 即Y的变化与X无关; H1:β≠0。
T检验步骤
❖ 1. 建立零假设H0:μ1 = μ2; ❖ 2.计算统计量T值,对于不同类型的问题选用
不同的统计量计算方法; ❖ 3. 根据自由度df=n-1,查T值表,找出规定的
T理论值并进行比较; 结合P值,做出结论。
❖ Z检验
Z检验
❖ 一般用于大样本(即样本容量大于30)平均值 差异性检验的方法.
二.假设性检验
❖ 假设检验(Test of hypothesis)
假设检验亦称“显著性检验(Test of statistical significance)”,是用来判断样本与样本,样本与总体的差 异是由抽样误差引起还是本质差别造成的统计推断方法。其 基本原理是先对总体的特征作出某种假设,然后通过抽样研 究的统计推理,对此假设应该被拒绝还是接受作出推断。 ❖ 主要包括T检验,F检验,Z检验,方差分析
个同质受试对象分别接受两种不同的处理;2,同一受试对象 接受两种不同的处理;3,同一受试对象处理前后。
❖ 两样本t检验:从两研究总体中随机抽取样本,要对这
两个样本进行比较的时候,首先要判断两总体方差是否相同, 即方差齐性。若两总体方差相等,则直接用t检验,若不等, 可采用t'检验或变量变换或秩和检验等方法。 其中要判断两总体方差是否相等,就可以用F检验。
❖ 偏差:随机变量的取值与均值的n 差
❖ 方差(variance)
(xi x)2
:反映一组数据的平均离散水S 平2 i1
n 1
一.反映数据变异程度大小的指标
❖ 标准差(standard deviation)
:方差的正平方根,使用的量纲与原量纲相同,适用于 近似正态分布的资料,最n 为常用
(xi x)2
❖ 2.t值计算:
❖ 3.结论:回归系数是否有意义;对应的自变量是否 有意义。
单因素方差分析
❖ 是用来研究一个控制变量的不同水平是否对 观测变量产生了显著影响。
❖ 步骤:
❖ 1. 明确控制变量和观测变量 ❖ 2. 剖析控制变量的方差分析,总的离差平方和分解为组间和
组内两部分 ❖ 3. 通过比较观测变量总离差平方和各部分所占的比例,推断
离差平方和计算公式
SS总=SS间+SS内
假设性检验的步骤
❖ 1.建立假设,确定检验水准α
零假设(H0)和备择假设(H1)
❖ 2.根据研究目的和设计类型选择适合的检验 方法
主要包括T检验,F检验,Z检验,方差分析
❖ 3.确定P值并作出统计结论
方差分析
❖ 方差分析(analysis of variance,ANOVA)
英国统计学家R.A.Fisher首先提出的,所以又叫F检验
用Excel做统计学分析
一 . 反应数据变异程度大小的概念 二. 假设性检验 三. 一元线性回归
一.反映数据变异程度大小的概念
❖ 极差(range)
:亦称全距,即最大值与最小值之差
❖ 四分位间距(inter-quartile range):第3 四分位数
(Q3= P75)和第1 四分位数(Q1= P25)相减计算而得, 常与中位数一起使用,描述偏态分布资料的分布特征,比极 差稳定。
s i1 n 1
一.反映数据变异程度大小的指标
❖ 变异系数(coefficient of variation)
:用于观察指标单位不同或均数相差较大时两组资料变
异程度的比较
CV
s
100%
x
正态分布
❖ 正态分布:若指标X 的频率曲线对应于数学上的正态曲线, 则称该指标服从正态分布(normal distributij x)2
i1 i1
m
SS间 ni(Xi X)2 i1
m ni
SS内
(Xij Xi)2
i1 j1
如果组间离差平方和所占比例较大,则说明观测变量的变动主要是由控制变量引起 的,可以主要由控制变量来解释,控制变量给观测变量带来了显著影响
方差分析表
F检验—方差齐性分析
方差齐性分析