当前位置:文档之家› 资料分析的基础工作讲义(ppt 65页)

资料分析的基础工作讲义(ppt 65页)

注意同步分析中选取因素的相关性。
经济与管理学院 雷晶
8.3 资料的表格化与图形化初步分析
4. 横列表的局限性
多因素分析困难; 可能遗漏需要分析的因素; 关键因素的选择比较困难。
经济与管理学院 雷晶
8.3 资料的表格化与图形化初步分析
三、数据分析
数据分析(data analysis)是从实际观测数据中 发现变量的特征、变化规则以及变量之间关 联的过程。
>1万公 <1万公


51
73
50
73
49
27
50
27
7 170 2 150 2 430 6 050
☻结论:事故率是与驾驶里程数相关,而不是性别。
8.3 资料的表格化与图形化初步分析
1. 横列表中使用因素的选择 横列表使用的成功,取决于研究者选择的关键
因素,以及根据这些因素组成横列表的能力。
a) 简单的事实收集 b) 描述性研究 c) 探索性研究
经济与管理学院 雷晶
主要内容
8.1 资料的整理 8.2 资料的分析与解释概述 8.3 资料的表格化与图形化初步分析 8.4 资料的解释
经济与管理学院 雷晶
8.3 资料的表格化与图形化初步分析
一、每个问题的表格化和图形化分析工作
1. 频率分布分析 2. 平均值分析——算术平均数、中位数和众数
平均值分析与频率分布分析相比,往往会“吞” 掉一些信息,故而不一定是很好的数据处理指 标。
100 400 500
100 400 500
时段2考察
100 400 500
100 400 500
时段2典型对象报告 品牌A 购买 不购买 总计
时段2典型对象报告 品牌B 购买 不购买 总计
纵向数据
时段1典型对象报告
品牌A
购买
不购买
100 0 100
购买
0 400 400 品牌B 不购买
0
100
100
经济与管理学院 雷晶
主要内容
如:公司员工平均收入 Vs. 各阶层收入及频率
经济与管理学院 雷晶
中位数的应用——区间型定序尺度的描述
管理研究常把变量属性集结成组,然后给出每组 的属性频率,如:
花销范围 <100
101~200 201~300 301~400
>400
学生人数 75 97 76 66 36
累计人数 75 172 248 314 350
如何确定学生每月花销的具体数据呢?
Md LN 2cf f
Md——中位数; L ——中位数所在属性组的下限; N ——样本总数; cf ——中位数所在组以下的累计数; f ——中位数所在组的样本数; ω ——中位数所在组的属性间距。
1. 先找出中位数所在的属性组
总和
2,431 2,064 1,976
分组随机实验,但分析不深入,得出了错误的结论。
补充:市场调查设计
总结性调查
总结性调查(描述性调查和因果性调查)普遍 使用横截面市场调研设计。
横截面调研设计,也就是在一个时间点抽取一 个人口样本,通常称为“调研考察设计”。
特点:准确性、可靠性要求高
补充:市场调查设计
横截面调研设计 Vs. 纵向调研设计
横截面调研设计因为是对不同应答者样本的衡 量,可能会误导调研结果;
纵向调研设计由于是对相同应答者样本的重复 衡量,可以更准确地衡量变化和发展趋势。
经济与管理学院 雷晶
品牌A 购买 不购买 总计 品牌B 购买 不购买 总计
横截面数据 时段1考察
一、分析与解释的定义
分析是以某种有意义的形式或次序把收集的资 料重新展现出来。
解释是指在资料进行分析后找出信息块之间或 与其他已知信息之间的联系。
解释是把分析的资料、数据转变成信息的过程。
经济与管理学院 雷晶
前述案例,研究“性别”与“每周买报的个人花费” 之间的关系。
Analyze——Compare Means——Means
经济与管理学院 雷晶
8.3 资料的表格化与图形化初步分析
2. 从横列表里发现含义 阅读教材P157 案例8-3 谁是常看电影的人?
经济与管理学院 雷晶
8.3 资料的表格化与图形化初步分析
3. 同步分析与顺序分析
顺序分析简单,但是容易导致错误结论; 同步分析善于解释事物之间的真实关系,但要
三、表格化
开放式问题分类归档的应用
阅读教材P164 案例1 对市长的评价,思考对开 放式问题进行归档处理应注意的问题
经济与管理学院 雷晶
主要内容
8.1 资料的整理 8.2 资料的分析与解释概述 8.3 资料的表格化与图形化初步分析 8.4 资料的解释
经济与管理学院 雷晶
8.2 资料的分析与解释概述
1,350
2
193,500
3,300
3
171,000
15,900
4
154,000
37,950
1
151,500
60,000
2
145,500
69,600
3
132,000
79,500
4
121,500
91,500
结论:新产品可以替代老产品,老产品可以退市了。
案例8-1 如何正确分析不同广告的效果?
东风汽车公司要对3种广告设计进行测试,以判定哪一 种设计方案对提高汽车销量最有效。研究人员在不同时间 里分别选择在4个不同城市进行了市场试验,结果如表8-4。
300
100
400
总计
100 400 500
总计
100 400 500
补充:市场调查设计
纵向调研设计的特点
优点:准确性高、低成本
群体相对稳定,具有长期合作性 数据收集技术相对专业、先进
缺点:代表性差和应答偏差
群体的流动性及替代者的代表性 对象的厌倦与熟练性
纵向调研设计应 用:请参阅教材 P263-266 消费者 固定样本连续调 查
经济与管理学院 雷晶
补充:市场调查设计
业绩监控调查
业绩监控调查普遍使用纵向市场调研设计。 纵向市场调研设计一般适用于连续的业绩监控
需要,基本思路就是对固定人口样本(panel sample)进行反复衡量,所以经常被称为“典型 对象调研设计”。 特点:连续性、常规性,可比性高
经济与管理学院 雷晶
数据分析包括:描述统计 & 推断统计
经济与管理学院 雷晶
I. 描述统计(descriptive statistics)
一、单变量描述统计(univariate descriptive statistics)
1. 频数和频率分布 2. 集中趋势(central tendency)——众数(mode)、
③ 对全部答案分布表进行挑选归并,确定可以接受的 分组数;
④ 根据分类归纳的结果,制成正式的答案分布表。
经济与管理学院 雷晶
被调查者对XXX的看法分布
看法分类
答案人数
符合环保要求
325
符合时代潮流
286
符合消费需求
316
希望尽快推出
198
有可能实现
312
不可能实现
350
难以评价
213
合计
2000
比重(%) 16.25 14.30 15.8 9.90 15.6 17.50 10.65 100.00
Scale
经济与管理学院 雷晶
三、表格化
表格化是使答案以某种报告的形式出现,最 常见的表格化形式是频率分布和百分比分布。
您是否会买这种产品? 绝对会买
很可能会买 不知道
很可能不买 绝对不买 总和
Hale Waihona Puke 数值(频率) 124 211 376 204 200 1115
经济与管理学院 雷晶
百分比(%) 11.1% 18.9% 33.7% 18.3% 17.9% 100.0%
1. 多变量关联表 2. 偏相关分析和多元回归分析 3. 因子分析
经济与管理学院 雷晶
II. 推断统计(inferential statistics)
一、参数估计
1. 点估计 2. 区间估计
经济与管理学院 雷晶
II. 推断统计(inferential statistics)
二、假设检验
1. 对立假设 2. 显著性实验 3. 参数和非参数检验
中位数(median)和平均数(mean) 3. 离散趋势(dispersion tendency)——极差(range)、
四分互差(quartile deviation)、标准差(standard deviation)
经济与管理学院 雷晶
I. 描述统计(descriptive statistics)
二、双变量描述统计(bivariate descriptive statistics)
1. 定类和定序变量的关联分析——关联表、关联 性分析
2. 定距和定比变量的关联分析——回归分析、相 关分析
经济与管理学院 雷晶
I. 描述统计(descriptive statistics)
三、多变量描述统计(bivariate descriptive statistics)
35 1 0 /2 17 55
2. 计算中位数
Md L N 2cf f
201 3250 1727699 205
3. 结果:被抽查的350名学生的平均花销为205元
8.3 资料的表格化与图形化初步分析
二、多问题和多因素的综合分析——横列表法
39 17 800
表8-9 男女驾驶者的事故率
相关主题