当前位置:文档之家› 市场调研调研数据深入分析

市场调研调研数据深入分析


t x1 0 1.7 2 4.8
Sx
0.25
n
16
采用单侧检验,查t分布表得t 1)=1.756
α(n-1)=t0.05(20-
到|t预|>期t效0.05果(20-1), 否定H0,接受H1,认为促销未达
3、F检验 F检验是在方差未知的条件下,关于两个总体方
差相等的假设检验。
H0
:
2 1
做出统计 判断,即 拒绝或接受 原假设
针对调研 问题做出
结论
(1)提出原假设H0和备选假设H1
• 原假设是有关变量等价、相同或没有差异 的判断性描述;被择假设是原假设的对立 假设。
• 市场调研中,如果原假设被拒绝,则认为 与备择假设一致的期望结论有统计意义。
• 假设检验分为单侧和双侧检验,当备择建 设的数学表达式是单向严格不等式时,选 择单侧检验;当备择假设的数学表达式是 等式形式时为双侧检验
S
2 x
1 n
n
(Xi
i 1
X )2
(4)标准差:意义同于方差,比方差更常用。
Sx
n (Xi X )2 i1 n -1
Sx
n
n
1
S
2 x
三、频数分布的SPSS应用 p.169
第二节 假设检验
一、假设检验过程 1. 假设检验的基本步骤
提出原假设 H0
和被择假设 H1
选择统计 方法和对应 的统计量, 并针对选 定的显著 性水水平α, 计算统计量, 确定拒绝域
在H0不被拒绝,在没有特殊情况的前提 下,暂不做出行动。
(2)选择统计方法和对应的统计量,并针对选定的 显著性水平α,计算统计量值,确定拒绝域
• 选定显著性水平α是指由于样本结论导致错误的 拒绝了原本正确的原假设的概率。对显著性水平 α的选取受调研预算的限制,一般α=0.01或 0.05
• 某种统计方法下对应的样本统计量的分布决定拒 绝域,而选择什么样的样本统计量与已知条件和 代估参数有关
市场调研结论:是否该实施某方案
二、参数检验与统计量的分布
1、z检验 z检验分为单变量的z检验和双变量的z 检验,是关于总体均值的假设检验。
(1)单变量情形。变量X服从均值为μ0、方 差为σ2的正态分布,均值和方差已知。
H0:μ= μ0 ,H1: μ ≠ μ0
检验的样本统计量为
z X n
服从正态分布,在显著性水平α下, H0的拒绝域为|z|>zα/2。zα/2为查正态分 布概率表得到的临界值
定能找到真正的关系
二、与交叉表有关的统计量
卡方统计量用来验证交叉表中变量间的 关联程度以及这种关联程度的统计显著性。
原假设H0:两个变量特征相互无影响 备择假设H1:两个变量特征相互影响
• 卡方统计量的数学表达式
x2 (Oij Eij )2 / Eij
i, j
Oij为单元(i,j)的观察频数 Eij为单元(i,j)的期望频数,其计算公式为 Eij=ninj/n ni为交叉表某行总频数,nj为交叉表某列总频 数, n为样本容量
0.05下,查表知 xa2 (n 1) 5.99 ,
x2> xa2 (n 1),拒绝H0,接受H1 • 三种口味的消费者偏好度有显著差异,火腿口味
选的最少,口味偏好度低
第三节 交叉表
一、交叉表的概念 交叉表是一种以表格的形式同时描述两
个或多个变量以及结果的统计方法,反映 了这些只有有限分类或取值的变量的联合 分布。
卡方统计服从卡方分布x2[(r-1)(s-1)],r为第一个变 量下的类别数,s为第二个变量下的类别数
在给定显著水平α和已知自由度的情况下,当 卡方统计量的计算值大于卡方分布的临界值,拒 绝原假设,接受备择假设,变量间有关联。
• 例:9-4 因特网使用率与上网者的性别有关 吗?p180
第一步:计算期望频数 Eij=ninj/n 计算卡方值
在给定显著性水平α下,拒绝域为
ⅹ2> ⅹ α 2(n-1) ⅹ α 2(n-1)查卡方分布表中获得临界值
例:9-2(p177) 奶酪口味偏好程度,调查了 210人,要求对三种奶酪口味偏好程度进行 调查,选出最喜欢的一种,结果如下
口味
原味
选择人数 90
火腿 45
草本 75
根据以上数据统计判断三种口味的奶酪 偏好程度是否有显著差异。
第九章 调研数据深入分析
基本数据分析与SPSS软件
本章内容
(1)频数分布 (2)假设检验 (3)交叉表
本章重点
1 利用频数分布进行初步数据分析的方法 2 交叉表数据分析方法 3 针对交叉表的假设检验方法 4 SPSS软件在基本数据分析中的应用
第一节 频数分布
一、频数分布的概念 记数某变量所有取值的个数,以百分数的
1 2 2 3 4 5 2 5 3 2 6 7 众数:2 • 中位数:当样本对变量的取值按递增或递
减排序时,若取值是基数,则中间位置的 数值为中位数;若取值是偶数,中间位置 两个数值的平均数为中位数。
1 2 3 4 5 6 7 8 9 中位数:5
1 2 3 4 5 6 7 8 9 10 中位数:5.5
正态分布:Z检验
t分布:t统计量检验
F分布:F-检验
(3)在显著性水平α下,从统计学角度判定 是否拒绝原假设。将样本数值带入到拒绝 域,检验是否满足拒绝域,并依据数理统 计学理论判定是否拒绝原假设。
(4)做出市场调研结论,即由假设检验得出 的结论转换为市场调研课题结论的表达。
假设检验的结论:接受或拒绝原假设,拒绝 或接受备择假设

踏实,奋斗,坚持,专业,努力成就 未来。20.12.120.12.1T uesday , December 01, 2020

弄虚作假要不得,踏实肯干第一名。15:04:49 15:04:4915:0412/1/2020 3:04:49 PM

安全象只弓,不拉它就松,要想保安 全,常 把弓弦 绷。20. 12.115: 04:4915:04Dec -201- Dec-20
形式表示 一个变量的频数分布是关于这个变量的频
数统计表,包括与变量相关的频数百分比及 累计百分比。
频数分布有助于发现那些不相关或不合理 项。
频率(频数占综频数百分比)在对数据进 行解释和判断方面更为直观。
二、频数分布中常用的统计量
(1)位置度量:平均数、众数、中位数
从不同角度描述了变量取值的中心趋势, 对定类变量选择众数,对定序变量选择中 位数,对定距和定比变量选择平均值。
2 2
H1
: 12
2 2
(双侧)
F

S12 (较大) , S(22 较小)
1=n1 1, 2=n2 1
两临F个界服样值从本 取自的 决由样 于度本 自为容由(量度v1,,。v2在S)的1、显FS分著2分布性别。水为n平1样、α本n下2标分,准别H差为0的, 拒1概),绝率F域表α/2为 得(nF到1 >-1的,Fα临/2(nn界21-1-值)1和,。Fn1-2α-/21(n),1 -1F,<nF21--α1/2)(为n1查-1,t分n布2-
(2)双变量情景
两个总体方差未知但相等,σ12=σ22, H0: μ1 = μ2 ,H1: μ1 ≠ μ2 0 检验统计量为:
t
X1 X2
(n1
1)S 2 1
(n2
1)S
2 2
n1 n2 2
它服从正态分布,n1和n2为两个独立样本的样 本容量,在显著性水平α下, H0的拒绝域为 |t|>tα/2(n1+n2-1)。
(2)差异度量:极差、四分位极差、方差、 标准差
差异度量用于定距变量或定比变量的变 化性度量。
1、位置度量 • 平均数:最常用的中心趋势度量指标,平
均数是一个平稳值,少量增加或删减样本, 数值不会有明显的改变。
∑x
x= n
1,2,3,4,5,6,7,8,9 均值=5
• 众数:样本众数是样本对应变量取值中出 现次数最多的值,又叫峰值。
本章小结
• 频数分布 • 位置度量(平均数、众数、中位数) • 差异度量(极差、四分位极差、样本方差、
标准差) • 参数检验、非参数检验 • 交叉表
20.12.115:04:4915:0 415:0420.12.120.12. 115:04
谢谢
15:04 20.12 115:0
2020年12月1日星期二3时4分49秒
(3)单变量情形的卡方检验主要用于对频数 表中各类对某变量特征的差异性分析
• H0:不存在由于变量X而导致的类别差异 H1:存在由于变量X而导致的类别差异
• 卡方统计量的数学表达式为
ⅹ2=∑(Oi-Ei)2/Ei 其中,Oi为单元i的观察(实际)频数,Ei为单元i 的理论期望频数,统计量服从卡方分布,期望频 数和观察频数之间的差值越大,卡方统计值越大。
例:某企业研究促销活动对销售效果的影响,原 预计实施促销后,产品的月销售额可增至2万元, 促销活动后,研究人员对销售额进行了调查,发 现促销后的月销售额只有1.7万元,标准差为0.25 万元,能否由此推断促销没有达到预期的效果? H0: μ=2, H1: μ<2 要求 α=0.05,n=16,Sx=0.25, 采用t检验 计算检验统计量
参数检验总结:
(1)关于均值的检验,不论单、双总体,当 方差已知时,用z检验,否则用t检验,大样 本情景,都可以用z检验
(2)关于方差的检验,双总体方差相等假设 需用F检验。
三、非参数检验与统计量的分布
(1)非参数检验适用于定序变量和定类变量 的假设检验。常用的方法是卡方检验
(2)卡方检验主要用于对独立样本本身和不 同独立样本之间不同因素的差别检验
x2
(Oij Eij )2 / Eij
相关主题