当前位置:文档之家› 谁说菜鸟不会数据分析整理概括版本

谁说菜鸟不会数据分析整理概括版本

数据分析的三大作用一、现状分析简单来说告诉你过去发生了什么第一:告诉你企业现阶段的整体运营情况,通过各个经营指标的完成情况来衡量企业的运营状态,以说明整体经营是好还是坏,以及好坏的程度。

第二:告诉你企业各项业务的构成,让你了解企业各项业务的发展及变动情况,对企业运营情况有更深入的了解。

二、原因分析简单来说告诉你某一现状为什么发生。

运营情况具体好在哪里,差在哪里。

三、预测分析将来会发生什么对企业的未来发展趋势作出预测,一般通过专题分析来完成的,通常在制定企业季度、年度等计划时进行的,其开展的频率没有现状分析及原因分析高。

数据分析六部曲一、明确分析目的和思路1、明确分析目的(为什么开展数据分析?通过这次数据分析我要解决什么问题?等等)2、确定分析思路(如何具体开展数据分析,需要从那几个角度进行分析,采用那些分析指标。

要知道先分析什么,后分析什么,使得各个分析点之间有逻辑关系。

通俗来说以营销、管理等理论为指导,结合实际业务情况,搭建分析框架,这样才能确保分析维度的完整性,分析结果的有效性及正确性。

营销理论模型有4p、用户使用行为、stp理论、swot等,管理方面理论pest、5w2h、时间管理、生命周期)3、数据分析方法论(指数据分析思路比如从哪几方面开展数据分析?各方面包含什么内容和指标?是数据分析的前期规划,指导着后期数据分析工作的开展。

及数据分析方法不同,前者是宏观角度分析的,后者是从微观角度分析的包括对比分析、交叉分析等等方法。

)常用的方法论有:PEST(是指影响一切行业和企业的各种宏观力量。

一般应对的是政治、经济、技术、社会);5W2H(何因、何事、何人、何时、何地、如何做、何价);逻辑树分析法(将问题的所有子问题分层罗列,从最高层开始,并逐步向下拓展。

遵循3个原则:要素化;把相同问题总结归纳成要素,框架化:将各个要素组织成框架,遵守不重不漏的原则,,关联化;框架内的各要保持必要的相互关系,简单而不孤立);4P营销理论(四要素:产品(有形产品、服务、人员、组织、观念和它们的组合)、价格(基本价格、折扣价格、支付期限。

影响定价因素:需求、成本、竞争)、渠道、促销(促销组合:广告、宣传推广、人员推销、销售促进))用户行为理论(指用户为获取、使用物品或服务所采取的各种行动,用户对产品首先有一个认知、熟悉的过程、然后试用,再决定是否继续消费使用,最后成为忠诚用户。

)二、数据收集数据收集是按照确定的数据分析框架,收集相关数据的过程,它为数据分析提供了素材和依据。

一般数据来源主要有以下几种方式:数据库(公司自身数据库)、公开出版物(中国统计年鉴)、互联网(搜索引擎)、市场调查(专门的调查)三、数据处理数据处理的基本目的是从大量的、杂乱无章、难以理解的数据中,抽取并推导出对问题有价值、有意义的数据。

数据处理主要包括数据清洗、数据转化、数据提取、数据计算等处理方法。

1.数据清洗找出重复数据(函数法、高级筛选法、条件格式法、数据表透视法)删除重复数据(菜单删除重复选项、通过排序删除重复选项、筛选删除重复选项)缺失数据处理(缺失值接受标准10%以下):定位输入(查找):开始-编辑-定位条件-空白-确定处理方法(四种):样本统计量值替代缺失值(常用平均值)统计模型计算的值替代(回归模型、判别模型)将缺失数据删除(样本量减少)将缺失数据记录保留,仅在相应的分析中做必要的排除检查数据逻辑错误(利用IF函数检查错误、利用条件格式标记错误:OR,AND)2.数据加工数据抽取:保留元数据表中某些字段的部分信息,组合成一个新字段。

(字段分裂:菜单法.数据-数据工具-分裂其他选项按自己需求填写函数法.LEFT&RIAHT;字段合并,字段匹配)数据计算:简单计算(加减乘除)、函数计算(sum、average等)、3.数据分组:(VLOOKUP)4.数据转换数据表的行列互换(开始-剪贴板-粘贴-选择性粘贴-对话框里面的转置)5.数据抽样使用RAND四、数据分析数据分析是指用适当的分析方法及工具,对处理过的数据进行分析;提取有价值的信息,形成有效结论的过程。

数据处理是数据分析的基础,通过数据处理,将收集到的原始数据转化为可以分析的形式,并且保证数据的一致性和有效性。

数据挖掘是一种高级的数据分析方法。

数据挖掘是人们长期对数据库技术进行研究开发的结果。

数据挖掘侧重解决四类数据问题:分析、聚类、关联和预测,重点需找模式和规律。

数据分析方法三大作用:现状分析(对比)、原因分析(细分)、预测分析(预测)1.对比分析法:将两个或两个以上的数据进行比较,分析差异,从而揭示数据所代表的事物发展情况和规律性。

可分为静态比较(同一时间条件下对不同总体指标的比较如不同部门、不同地区、不同国家的比较,也叫做横向比较),动态比较(在同意总体条件下对不同时期指标数值的比较,也叫纵向比较)。

在实践运用中,及目标对比,不同时期对比,同级部门、单位、地区对比,行内对比,活动效果对比。

进行对比应该注意到以下几点因素:指标的口径范围、计算方法、计量单位必须一致;对比对象的可比性,对比对象之间相似处越多越具有可比性;对比的指标类型必须一致。

2.分组分析法:把数据分析对象划分为不同的部分和类型来进行研究,以揭示其内在的联系和规律。

步骤:确定数组、确定各组的组距、根据组距大小,对数据进行分组整理,划归至相应组内。

3.结构分析法:总体内各部分占总体的比例属于相对指标。

一般来说,某部分的比例越大,说明其重要程度越高,对总体的影响越大。

4.平均分析法:运用计算平均的方法来反应总体在一定时间、地点条件下某一数量特征的一般水平。

平均指标可用于某一同一现象在不同地区、不同部门、不同类型部门、不同时间。

有两特点,一是如上,二是某些现象在不同历史时期的变化,更能说明发展趋势和规律。

5.交叉分析法:通常用于两个变量之间的关系即同时将两个有一定联系的变量及其值交叉排列在一张表格内,使各变量值成为不同变量的交叉节点,形成交叉表,从而分析交叉表中变量之间的关系。

如二维表6.综合评价分析法:人们通过对实践活动的总结,逐步形成了一系列多个指标对多个参评单位进行评价的方法。

步骤:1)确定综合评价指标体系2)收集数据3)确定指标体系中各指标的权重,以保证评价的科学性4)对经处理后的指标在进行再进行汇总计算出综合评价指数或综合评价分值5)根据评价指数或分值对参评单位进行排序,并由此得出结论。

三大特点:通过一系列特殊方法将多个指标同时完成,要根据指标的重要性进行加权处理,以指数或分值表示参评单位综合状况的的排序。

权重确定的方法:专家访谈法、德尔菲法、层次分析法、主成分分析法、因子分析法、回归分析法、目标优化矩阵表7.杜邦分析法:利用主要财务指标间的内在联系,对企业财务状况及经济效益进行综合分析评价的方法。

8.漏斗图分析法:适合业务流程比较规范、周期比较长、各流程环节涉及复杂业务过程比较多的管理分析工具。

9.矩阵关联分析法:指根据事物的两个重要属性作为分析的依据,进行分类关联分析,找出解决问题的一种分析方法。

目标优化矩阵表:把人脑的模糊思维简化为计算机的1/0式逻辑模式数据分析工具:数据透视表五、数据展现一般情况下,数据是通过表格和图形方法来呈现的。

图形的种类很多。

(能用图说明问题的就不用表格,能用表格说明问题的就不用文字。

)通过关系选择图表:成分(用于表示整体的一部分,饼图、柱形图、条形图、瀑布图)、排序(比较大小进行排列)、时间序列(表示某事按照一定的时间顺序发展的走势、趋势)、频率分布(用于表示各项目、类别间的比较)、相关性(用于衡量两大类中各项目间的关系)、多重数(1表示已被选中)图标制作五步法:1.确定所要表达的主体或目的2.确定哪种图表适合你的目的3.选择数据制作图表4.检查是否有效的展示数据5.检查是否表达了你的观点表格注意事项1.突出单元格(用特殊背景,颜色突出个别项:开始-样式-条件格式-突出显示单元格规则)2.项目选取(及上不同的是指定的规则不同,突出显示的单元格的规则指定值是及原始数据相关的数据同上所选)3.数据条(数据条越长,表示数值越大….)4.图标集(对数据进行注释,并可以按照临界值,将数据分为3-5个类别)5.迷你图(可提供对数据的形象表示)图表换装1.平均线图(在原来的柱形图或折线图的基础上,添加一条平均线或则标准线。

先列出数据及平均数据,选取所给的数据做柱形图,选柱形图中的“平均值”的任一条柱,右击选“更改系列图表类型”把柱形图改为折线图不带数据标记)2.双坐标图(图中有两个及其以上数据,并且他们的量纲不同或者数据差别很大,在一纵坐标下就无法很好的展现原数据的面貌,做法同上只不过要带数据标记)3.竖形折线图(主要用来展示产品功能、品牌形象等在消费者心中的评价)4.瀑布图(第n个占位数据的大小=(总成本-(成本1+成本2+成本3+….成本n)))5.帕累托图(又叫排列图,主次图;)6.旋风图(同一事物在某个活动、行为影响前后不同指标的变化;在指标a变化下,指标b影响也随之变化,具有因果关系;两个类别之间不同指标的比较,如某班男女同学成绩的比较)7.人口金字塔图(专门用来反应人口过去、现在、未来的发展情况)8.漏斗图9.矩阵图(散点图)10.发展矩阵图11.改进难易矩阵(气泡图)(以上图形做法百度便可)美化图表1.别让图表犯错(标题、图例、单位、脚注、资料来源)2.制作图表的规则避免生出无意义的图表(作图表及否标准:能否帮助你有效表达信息)避免信息量过大(一张图表反应一个观点,才能突出重点)基本院原则:简约,标题要有吸引力图形的注意事项:1.饼图(把数据从12点钟的位置开始排列最重要成分靠近12点钟的位置,数据项5个以内,不要使用饼图分离,不要使用图例;数据超过5项使用复合饼图)2.柱形图(同一数据序列使用相同的颜色,不要使用倾斜的标签,别让读者歪着脑袋看)3.条形图(同一序列使用相同的颜色,尽量让数据由大到小排序,方便阅读,不使用倾斜的标签,最好添加数据标签)4.折线图(折线的线型要相对粗些要有突出的感觉,线条一般不超过5条若过多可以分开作图表,不使用倾斜的标签,纵坐标从0一般开始)图表会说谎虚张声势的增长(对增长比较平缓的图形进行拉伸)3D效果的伪装(3D效果的图表让人理解起来困难重重,使得图表显得拖沓繁沉)一维图形的障眼法(使用图形的大小来表示增长)图表美化三原则1.简约(简明扼要、清晰明了)2.整洁(整整齐齐、干干净净、和谐自然)3.对比(是指突出某些重要,帮助读者迅速抓住信息)美化图标的技巧1.最大化数据墨水比(图表中的每一滴墨水都要有存在的理由即尽量减少和弱化非数据元素—网格线、坐标轴、填充色等及数据源有关,增强和突出数据元素—曲线、条形、扇形等及数据源无关)步骤:1.去掉不必要的背景填充色2.去掉无意义的颜色分类3.去掉装饰性的渐变性4.去掉网格线、边框5.删掉不必要的图例6.去掉不必要的坐标轴7.去掉装饰行的图片8.以上不能去掉的元素要尽量淡化9.对需强调的数据元素进行突出标识2.找出隐形的线(注意图表中元素的位置,应找出能够及之对齐的元素)图表喜欢的数字格式(数据标签很多时,可考虑改成Arial字体)4.如何突出对比(使用醒目的颜色、直线、箭头、阴影将元素突出,切记对比的目的:让读者快速地领悟重要信息,其次才是吸引读者的眼球,调动他们的兴趣)制作属于自己的模板,快速作图f11键,添加小工具jwalk chart tools 通过加载宏来加载,这个工具需另外下载;修剪超大值六、报告撰写数据分析报告是对整个数据分析过程的一个总结和呈现。

相关主题