当前位置:文档之家› 列联表

列联表


‥ ‥ nba ‥ ‥ n.a
概率分布表
特征A 合计 A1 B1 特 征 : B Bb 合计 B2 p11 p21 : pb1 p.1 A2 p12 p22 : pb2 p.2 ‥ ‥ Aj ‥ ‥ p1j ‥ ‥ p2j : : ‥ ‥ Aa ‥ ‥ p1a ‥ ‥ p2a : : p1. p2. : pb. 1
逻辑分类的原则
从方法的角度看,逻辑分类法所规定的 逻辑原则是进行分类的基础。进行分类,应 遵循以下逻辑原则:
⒈每个层次的分类必须按同一标准或准则进行。 ⒉必须按照事物的属种包含关系分层次进行。 ⒊分类得到的种与种之间必须是不相容的,即相互 独立的。 ⒋分类所产生的种的概念外延之和必须等于概念的 外延。
二维列联表分析
设特性A可以分为a类, 特性B可分为b类。随机观 察n个个体,把那些个体的属性A处于类型i,属性B 处于类型j的个体数在表中记为nij 。并且,
n. j = ∑ nij
i =1
a
ni. = ∑ nij
j =1
b
分别是属性A 处于类型j的个体数(列)和属性B处于 类型i的个体数(行)。 pij记为属性A、B分别处于类 型i、j的概率数,现作原假设H0:A、B两特性独立。 如果为真,则 H0: pij = pi. p. j (i=1,2,……,a; j=1,2,……,b) p 其中, i.为属性A处于类型i的概率,p. j 为属性B处于 类型j的概率。
第二章 信息分类分析
第一节 列联表
逻辑分类法
在分解方法中,分类方法是使用很早, 应用很广的一种方法。分类方法的基本思路 是:按照事物属性的异同将事物区别、划分 为不同的种类,因此,类是具有某种共同属 性的集合。 分类作为一种认识事物、区别事物的方 法已有几千年的历史了。一般来说,实用的 分类方法都是将事物区别为具有一定从属关 系的不同层次的大小类别,形成概念系统, 反映客观事物的联系和区别。
一维多项分类分析
将总体按照某种特性分为A1,A2,……Ak, 计k个类型,每一个体仅属于其中一个类型, 总体中属于k个类型的比例P1,P2,……Pk。 现从总体中随机抽查n个样本单位,其中属 于类Ai有ni个,i=1,2,…k。现作原假设: P1 = P2 =……= Pk 。
一维多项分类分析
2 k [ni − E (ni )] [ni − npi ] 2 χ =∑ =∑ E (ni ) npi i =1 i =1
合计
69 78 147
126 99 225
16 27 43
211 204 415
首先,应该考虑设定假设: H0:居民对地板的喜好与地区无关 H1:居民对地板的喜好与地区有关
如果H0成立,说明居民对地板的喜好与地区无 关,即居民对地板是否喜好与地区独立. 记:A={居民来自地区1}, B={居民喜好地板},则 P(A∩B)=p11,如果H0成立,则A与B独立,于是 P(A∩B)=P(A) ·P(B),而P(A) =p.1, P(B)=p1. ,从 而H0成立,必须有p11 = p1. · p.1 同理p12 = p1. · p.2 , p21 = p2. · p.1 故H0可表达成: H0: p ij = pi. · p.j H1:上述等式至少有一个不成立
一维多项分布的性质
多项分布是二项分布的扩展,可以看成是多项试验得到 的分布。有若干性质: 多项试验由n个相同的试验组成 每个试验的结果都落在k组中的某一组内 某个试验的结果落在某一特定组的概率在试验之间保持 k 不变。且有 ∑ pi = 1 i =1 试验是独立的 试验者关心的n1,n2,…nk,这里ni等于试验落在组i的数目。 注意,n1+n2+…+nk=n
列联表原理
在利用列联表进行分析时,首先表示出列 联表,列联表实际上是一个交叉的频数表, 利用所给频数构造一个卡方统计量,根据 样本数据计算得来的卡方值与一定自由度 下卡方临界值进行对比,从而判断是否接 受原假设。 实质上是品质相关的问题
列联表分析在处理两个或几个定性变量间 是否有真正意义上的独立问题是独具魅力。 其原因有三: 1、不必假定所感兴趣的总体服从何种分布; 2、列联分析适合于处理分类型变量间的关 系而且简单直观; 3、社会调查等大样本正好与列联分析的要 求相吻合. 主要介绍二维列联表分析
定义统计量
k
2
当n 充分大时,统计量服从自 E 由度为k-1的的χ2分布。式中,(ni ) 为属于类的期望频数,pi为属于Ai 类的样本频率。
一维多项分类分析
2 χ 2 > χ a (k − 1) , 给定显著性水平a,如果
则拒绝H0 ,即k个类型之间有显著差异 (或者说至少有一个类型与其他类型不 2 χ 2 ≤ χ a (k − 1) 同);如果 , 则 接 受 H0 , 即k个类型之间没有显著差异。
也算得上很大。故在0.05显著水平上否定H0, 即认为四个商场的服务质量的评价是显著不 一样的。 EXCEL软件实现过程 SPSS软件实现过程
操作过程如下: 操作过程如下: 选择Data→Weight Cases,进入Weight Cases对话框。 把“频数[f]”放入Frequency栏中,单击OK按钮。 从Analyze→Descriptive→Crosstabs,进入 ,进入Crosstabs 对话框。 对话框。把“商场”放入Row(s)栏:把“经营情况”放入 Column(s)栏。 单击Statistics按钮,进入 按钮, 对话框。选择Chi单击 按钮 进入Statistics对话框 对话框 square,单击continue按钮,返回Crosstabs主对话框。 单击Cell按钮,进入 按钮, 单击 按钮 进入Cell Display(格子显示)对话框。 (格子显示)对话框。 选择Observe、Expected、Row、Column,单击 Continue按钮,返回Crosstabs主对话框。 在主对话框中,单击OK按钮,提交运行Crosstabs过程。
按两个及以上特性(标志)对同一事物进 行分类,每一特性将事物分为若干个组, 利用这样的数据分析特性之间有无关系, 称为多维多项分析,由于它常借助于列联 表进行,所以又称为列联表分析。 列联表主要用于判断定性变量之间是否存 在相关关系。
举例
不同文化程度的人对某一些政策的态度? 不同地区的人与不同的工作作风的态度? 不同培训方法与培训后的业绩增长是否相干? 不同经历的人与他们对事物的看法是否一致? 不同民族与某种习惯是否相关? 不同层面的客户偏好与产品不同包装是否相关? 不同收入阶层对猪肉涨价的态度?
二维列联表分析
由于
pi. 、p. j 未知,常用估计值 ˆ ˆ p. j = n. j n 代替,则理论期望 pi. = ni. n

ˆ E (nij ) = ni. ⋅ n. j n 频数为
给定显著性水平a, 2 当 χ 2 > χ α [(a − 1)(b − 1)] 时,拒绝H0 ,属性Α、 Β不独立,存在相关关系; 2 χ 2 ≤ χ α [(a − 1)(b − 1)] 时,接受H0 ,属性Α、 当 Β相独立,不存在相关.
列联表
特征A 合计 A1 B1 特 征 : B Bb 合计 B2 n11 n21 : nb1 n.1 A2 n12 n22 : nb2 n.2 ‥ ‥ Aj ‥ ‥ n1j ‥ ‥ n2j : : ‥ ‥ Aa ‥ ‥ n1a ‥ ‥ n2a : : n1. n2. : nb. n
‥ ‥ nbj ‥ ‥ n.j
二维列联表分析
[例2.4] 在一次社会调查中,以问 在一次社会调查中, 卷方式调查了901 901人的年收入以及对 卷方式调查了901人的年收入以及对 工作的满意程度。其中, 工作的满意程度。其中,年收入分 为小于9000 9000元 9000元至24000元 元至24000 为小于9000元、9000元至24000元、 24000元至36000元以及超过36000元 元至36000元以及超过36000 24000元至36000元以及超过36000元 四档;对工作的满意程度B 四档;对工作的满意程度B分为很不 满意、较不满意、 满意、较不满意、基本满意和很满 意4档。调查结果可以用4×4列联表 调查结果可以用4 表示如下: 表示如下:
[例2.3]某市商业系统为提高商业服 务质量,对本市的四大商场进行调 查,收回有效问卷443张。每张问卷 对各商场按照优中差三种服务质量 评价,其结果用3×4列联表表示出 来,如表所示。试分析四个商场的 服务质量评价是否一致?
二维列联表分析
商场 绩效 优 中 差 合计 A 81 38 25 144 B 46 33 7 86 C 49 39 20 108 D 67 26 12 105 合计 243 136 64 443
二维列联表分析
[例2.2]一个建筑装饰公司对一个城市 三个地区的乔迁居民喜好地板的比例 感兴趣,目的是为了决定对这些地区应 采用何种营销策略.这个公司的调研部 门进行了一项调查,结果见下表,试证 明该城市不同地区的居民对地板的喜 好比例是否独立.
地 1 地 地 板 板 面 其 料 他 合计 2
区 3
‥ ‥ pbj ‥ ‥ p.j
‥ ‥ pba ‥ ‥ p.a
二维列联表分析
统计上已经证明,在n很大并且 E (nij ) i =1 j =1
a
b
[n
ij
− E (nij ) E (nij )
]
2
~ χ 2 [(a − 1)(b − 1)]
式中,期望频数 E (nij ) = npij , 且 H0 成 立 时 。 E (nij ) = npij = npi. p. j
二维列联表分析
期望频数估计表 绩效 优 中 差 合计 A 79 44.2 20.8 144 B 47.2 26.4 12.4 86 C 59.2 33.2 15.6 108 D 57.6 33.2 15.2 105 合计 243 136 64 443
相关主题