当前位置:文档之家› 非参数检验卡方检验讲解

非参数检验卡方检验讲解


行总和 பைடு நூலகம்1=100 R2=80 T=180
C1=120
( f oij f eij )2 f eij
(58 66.7)2 (42 33.3)2 (62 53.3)2 (18 26.7)2 7.61 66.7 33.3 53.3 26.7
2 0.05 (1) 3.84
独立性检验
配合度检验
• 例1:某大学二年级的公共体育课是球类 课,根据自己的爱好,学生只需在篮球、 足球和排球三种课程中选择一种。据以 往的统计,选择这三种课程的学生人数 是相等的。今年开课前对90名学生进行 抽样调查,选择篮球的有39人,选择足 球的28人,选择排球的23人,那么,今 年学生对三种课程选择的人数比例与以 往不同?
df (行数-1) (列数-1) 1
2 2 0.05 (1)
拒绝零假设,即男女对公共场所禁烟的态度有显著差异。
四格表的简易算法
赞成 男 女 A 58 C 62 A+C=120 不赞成 B 42 D 18 B+D=60 A+B=100 C+D=80 N=A+B+C+D=180
N ( AD BC ) 7.61 ( A B)(C D)( A C )( B D)
• • •
类别数据的处理形态: 次数与百分比 类别数据的呈现: 次数分布表与列联表 类别数据的分析: 卡方检验与其它关联性 分析法
卡方检验的主要内容


配合度检验
– – – – 某一个变量是否与某个理论分布或总体分布相符合 检验的内容仅涉及一个变量,是一种单因子检验 同时检测两个类别变量﹙X与Y﹚之间的关系时,其 目的在于检测从样本得到的两个变量的观察值,是 否具有特殊的关联。 检测同一个样本的两个变量的关联情形

2
f0 fe
fe
篮球 观察次数(fo) 期望次数(fe) 39 30
足球 28 30
排球 23 30
2 2 2 2 ( f f ) (39 30) (28 30) (23 30) 2 oi ei 4.46 fei 30 30 30
df 2
“Exact”可以定义各种不同分布下的显著性检验, 使计算更精确: “Asymptotic only”适合于渐进分布的大样本分 布。 “Monte Carlo” 适合不满足渐进分布的大样本分 布。 “Confidence”指定置信区间。 “Number of”指定近似法计算中的个案数。 “Exact”精确计算统计概率。 “Options”中可以设置选项: “Descriptive” 中将计算描述统计: 均值、标准差、最大值、最小值等。 “Quartiles” 四等分百分位数的计算。 缺失值“Missing Value”: “Exclude cases test by test”表示排除在做统计 分析的变量中含有缺失值的个案。
• t检验和方差分析(F检验)都属于参数 检验。他们有一个基本条件,就是要求 数据必须是连续的。在心理和教育研究 中,我们还会用到离散数据。
类别数据的分析
• 类别数据的产生
– 原发性类别数据:当被测定的变量的本质是 名义性的属性, 例如性别数据 – 操作性类别数据:以人为操作的手段所获致 的分类性数据, 例如实验操作的分类结果 – 虚拟化类别数据:由其它类型的数据型态转 换成类别形式的数据, 例如由连续变量转换 来的类别变量
赞成 男性 女性
不赞成
行总和
fo11 =58 fo12 =42 R1=100 fo21 =62 fo22 =18 R2=80 T=180
列总和 C1=120 C2=60
赞成 男性 fo11 =58 Fe11 =66.7 女性 fo21 =62 Fe21 =53.3 列总和
2
i j
不赞成 fo12 =42 Fe12 =33.3 fo22 =18 Fe22 =26.7 C2=60

2 0.05
(2) 5.99
2 2 0.05 (2)
接受零假设,即选择三种课程的学生数相等。
独立性检验
• 例2 为了解男女在公共场所禁烟上的态 度,随机调查100名男性和80名女性。男 性中有58人赞成禁烟,42人不赞成;而 女性中则有61人赞成,19人不赞成。那 么,男女在公共场所禁烟的问题所持态 度不同?
篮球 观察次数(fo) 期望次数(fe) 39 30
足球 28 30
排球 23 30
卡方检验的统计原理
• 卡方检验所检测的是样本观察次数﹙或百分比﹚ 与理论或总体次数﹙或百分比﹚的差异性。 • 理论或总体的分布状况,可用统计的期望值(理 论值)来体现 • 卡方的统计原理,是取观察值与期望值相比较。 卡方值越大,代表统计量与理论值的差异越大, 一旦卡方值大于某一个临界值,即可获得显著的 统计结论 2

Ei
经过查表可得到P P>α 不显著 P<= α显著
H0假设:样本的测量频数Qi与期望频数Ei差异不显 著。 二、操作步骤 执行[Analyze][Nonparametric Test][Chi-Square] 选择检验变量到“Test Variables”检验变量窗口中 回答期望值“Expected values”: “All categories equal”表示均匀分布,即每项的 频数都相等。缺省选项:总频数/分组数,这是一种平 均分布 “Values”为指定各个项的频数。 检验变量取值范围“Expected Range”: “Get from data”为不限定。 “Use specied range”指定上下限。
2
卡方检验基本前提
• 各小格之期望次数﹙或理论次数﹚不得 小于5。 • 不满足假设时的处理方法
– 小格合并法 – 增加样本数
– 去除样本法 – 使用Yate’s校正公式
非参数检验
χ2拟合优度检验 一、χ2检验概念 χ2检验是检验样本测量频数与期望频数的差异性。 例如:在某次考试结束后,对不同成绩进行统计的 结果: 分数段 期望频数Ei 测量频数Qi 0-60分 0 1 60-75分 4 6 75-85分 8 8 85-100分 4 3 2 ( Q E ) 按照公式: χ 2 i i
相关主题