当前位置:
文档之家› 市场调查资料的整理与分析培训课程
市场调查资料的整理与分析培训课程
❖ 调查泰山游客的满意度,从六个方面入手(吃、住、行、 游、购、娱),用5点量表来测量,其中,1=非常不满 意,5=非常满意。某游客在吃、住、行、游、购、娱 六方面打分分别为:5,4,4,4,2,1,计算该游客的 满意度的算术平均值和加权平均值
❖ 1. 算术平均值:x=(5+4+4+4+2+1)÷6=3.67
(一)数据的静态分析:
❖ 含义:分析现象当前的情况或者是本次调查的 情况。
❖ 主要方法有:
❖ 1、数据的统计描述: ❖ (1)数据的相对程度分析:频数(百分数),倍数, ❖ (2)数据的集中趋势:均值和均标准误差,中 位数,众数,
❖ (3)数据的离散程度:方差与标准差, ❖ 2、均值比较和T检验 ❖ 3、方差分析、相关分析、回归分析、因子分 析、聚类分析等
定性分析与定量分析 动态分析与静态分析
一、定性分析
是与定量分析相对而言的,它是对不能 量化的现象进行系统化理性认识的分析,其 方法依据是科学的哲学观点、逻辑判断及推 理,其结论是对事物的本质、趋势及规律的 性质方面的认识。
二、定量分析与预测
❖ 定量分析是指从事物的数量特征方面入 手,运用一定的数据处理技术进行数量分析, 从而挖掘出数量中所包含的事物本身的特性 及规律性,从而挖掘出数量中所包含的事物 本身的特性的分析方法。 ❖ 分类:静态分析和动态分析
相对程度分析
它通过对比的方法反映现象之间的联系 程度,表明现象的发展过程。
几分之几: 一比几: 倍数: 百分数:又叫频数(Frequency),是一 个变量在各个变量值上取值的个案数。
案例:对50名顾客有关“饮料品牌” 选择的调查
饮料品牌
可口可乐 旭日升冰茶 百事可乐 汇源果汁 露露
合计
不同品牌饮料的频数分布
方差分析分类:
Analysis of Variance (ANOVA )
❖ (1)单因素方差分析: 即不同水平下各个总体 的均值是否有显著的差 异。
❖ SPSS实现过程: Compare Means----One- Way ANOVA
❖ (2)多因素方差分析: 当需要比较多个控制 变量值之间有无明显 差异时采用。
无众数 原始数据: 10 5 9 12 6 8
一个众数 原始数据: 6 5 9 8 5 5
❖ 多于一个众数 原始数据: 25 28 28 36 42 42
中位数(Median)
❖ 中位数(Median)是把一组数据按递增或递减的顺序排列, 处于中间位置上的变量值就是中位数。
【例】:9个家庭的人均月收入数据
方差分析
Analysis of Variance (ANOVA )
❖ ANOVA 由英国统计学家R.A.Fisher首创,为纪 念Fisher,以F命名,故方差分析又称 F 检验 (F test)。 用于推断两个或多个总体均数有无差异。
❖ 方差分析的假定条件(上述条件与两均数比较的 t检验的应用条件相同.)。 ❖ (1)各处理组样本来自随机,独立的正态总体 (D法,W法,卡方检验); ❖ (2)各处理组样本的总体方差相等(不等会增 加I型错误的概率,影响方差分析结果 ❖ 的判断)。
分布的方差都相同,即满足"共方差性"的假设. ❖ (4) 残差序列互相独立:各个残差间相互独立,即对于任何
两个随机误差和其协方差等于零,即,Cov(,)=0, )这称之为满足 "独立性"的假设. ❖ 因此应该进行残差检验,判断回归模型的残差是否满足上述 假设
❖ A残差序列的正态性分布:通过残差序列的
如果相伴概率大于0.5,表示大于95%的概率表明两者 之间确实不存在明显差异,则零假设成立;如果相伴概率 小于0.5,表示小于95%的概率表明两者之间确实存在明显 差异,零假设不成立,则表明两者之间确实存在明显差异。
显著性差异一般用*表示。*表示significance level<0.05(2-tailed或1-tailed),** 表示significance level<0.01,*** 表示significance level<0.001。
❖ SPSS实现过程: Analyze----General Linear Model---Univariate
相关分析(Correlation analyze):
运用相关系数(r, Correlation coefficient)来表示两个变量间相 互的线性关系的统计方法。
❖ 如果变量Y与X间是函数 关系,则r=1或r=-1; ❖ 如果变量Y与X间是统计 关系,则-1<r<1, ❖ 如果x,y变化的方向一 致,如身高与体重的关系, 则称为正相关,r>0, ❖ 如果x,y变化的方向相反, 如吸烟与肺功能的关系,则 称为负相关,r<0 ❖ 而r=0表示无线性相关,
一般地,
❖ |r|>0.95 存在显著性相 关;
❖ |r| 0.8 高度相关; ❖ 0.5 |r|<0.8 中度相关; ❖ 0.3 |r|<0.5 低度相关; ❖ |r|<0.3 关系极弱,认为
不相关
因子分析(Factor Analyze)
❖ 用较少的综合指标分别综合归纳存在于各变量中的各类信息。 ❖ 统计要求: ❖ (1)一般要求变量之间的相关系数大于0.3 ❖ (2)巴特利特球形检验(Bartlett Test of Sphericity),要求
物以类聚、 人以群分
回归分析(regression analysis)
❖ 是确定两种或两种以上变数间相互依赖的定 量关系的一种统计分析方法。运用十分广泛。
❖ 按照涉及的自变量的多少 ,可分为一元回归分 析和多元回归分析
❖ 按照自变量和因变量之间的关系类型,可分 为线性回归分析和非线性回归分析
一元回归分析
原始数据:
1500 750 780 1080 850 960 2000 1250 1630
排序:
750 780 850 960 1080 1250 1500 1630 2000
位置:
12 3 4 5 6 7 8
9
中位数=1080
数据的离散程度分析
❖ 方差(Variance):是所有变量值与平均 数偏差平方的平均值,它表示了一组数据分 布的离散程度的平均值。
二乘法都可以计算出回量归方程参数,建立回归方程式。但 是,这样建立的回归方程并非一定有实用意义。 ❖ 1.相关分析(对于一元线性回归方程来说,也就是回归系 数的t检验),就是借用统计方法用计算自变量、因变量观察 样本资料的相关系数,说明变量之间的线性相关密切程度, 并通过r显著性检验指出这种线性相关密切程度的显著性水 平。 ❖ 2.方差分析(ANOVAF,回归方程的F显著性检验)是分析 自变量与因变量线性相关关系对因变量的变异的影响程度, 并通过F显著性检验指出反映自变量与因变量线性相关关系 的回归方程式的显著性水平。只有通过r显著性检验和F显著 性检验,才能说明建立的回归线性方程有实际意义。
❖ 5.回归方程的残差检验。 ❖ 对于上述回归模型中的随机误差要求满足如下的假设条件: ❖ 残差序列要求正态分布的随机性变量,且残差项之间互相独
立:
❖ (1)应当是服从正态分布的随机变量,即满足"正态性"的假 设.
❖ (2)残差的均值为零,即E(ε)=0,我们称满足"无偏性"的假设. ❖ (3) 残差序列满足随机性:的方差等于=,这就是说,所有的
频数
比例
15
0.30
11
0.22
9
0.18
6
0.12
9
0.18
50
1
百分比(%)
30 22 18 12 18 100
1999年全国国际旅游外汇收入构成
国际旅游收入(亿美元) 比重(%)
总计 长途交通 游览 住宿 餐饮 商品销售 娱乐 邮电通讯 市内交通 其他服务
140.99 41.65 7.49 20.34 15.28 27.71 8.45 4.11 5.33 10.63
因子分析(Factor Analyze)
❖ 在SPSS主菜单中按"Analyze→Data Reduction→Factor"顺序逐一单击鼠标键,打 开因子分析主对话框
聚类分析(Cluster Analyze)
❖ 聚类分析又称群分析,它是研究(样品 或指标)分类问题的一种统计分析方法。
❖ 在SPSS主菜单中按"Analyze→Data Reduction→Factor"顺序逐一单击鼠标 键,打开因子分析主对话框
❖ 设预测目标因变量为Y,影响它变化的一个自 变量为X,因变量随自变量的增(减)方向的 变化。一元线性回归分析就是要依据一定数 量的观察样本(Xi, Yi),i=1,2…,n,找 出回归直线方程
❖ Y=a+bX+ε (1)
❖ (三)回归方程需要通过的显著性检验 ❖ 对于任何给定的一组因变量、自变量观察样本资料,用最小
均值比较和T检验
均值比较(Compare Means):比较不同样本之间平均 值是否存在显著性差异。
T检验(T-Test): A单一样本的T检验(one-sample T test):研究研究 某一样本均值与指定值之间是否存在显著性差异。 B两独立样本T检验(Independent-samples T test): 独立样本是指两个样本之间彼此独立没有任何关联,两独 立样本各自接受相同的测量。两独立样本T检验的主要目的 就是了解这两个样本之间是否存在显著性差异。 C两配对样本T检验(Pared-Samples T test):是根据样 本数据对样本来自的两配对总体的均值是否存在显著性差
❖ 3.回归系数的显著性检验(t检验):对于一元线 性回归方程来说,回归系数的t检验就是相关系数的 显著性检验。
❖ 4.模型的拟合优度R2(Goodness of fit)分析:模型 的拟合优度表示所建立的回归方程预测值与实际观 察到的值之间差异的大小,一般用判定系数R2实现, R2越接近1,表明方程的拟合度越好,所建立的方程 与实际方程越接近。