数据分析新手入门资料(系列一)来源:知数教育网什么是数据分析? (2)如何用数据? (5)在数据分析、挖掘方面,有哪些好书值得推荐(43本全)? (6)一、到底什么是数据分析之前在微博上发起一个话题,大家一句话向外行说说什么是数据分析?有100多位同学参与讨论和转发,其中一些有意思的、不错的说法,大家一起来看看。
最专业的数据分析:@沈浩老师: 有针对性的收集、加工、整理数据,并采用统计和挖掘技术分析和解释数据的科学与艺术!最简洁的数据分析:@小蚊子乐园:简单的很,就是分析数据。
@Terensu:描述数据特征,预测数据趋势,展示分析结果。
@wangman02:从一大堆数据中提取到你想要的信息,就是数据分析。
最浪漫的数据分析:@数据化管理:数据分析就是:茫茫人海中,你通过观察、跟踪、记录等手段找到你生命中最想爱的那个人,进而根据对方的喜好,成功的展示了自己的优点,改进了自己的缺点,并且说服了对方的父母,承诺终身与ta为伴的一项工作。
@刘万祥ExcelPro: 你喜欢上一个姑娘,你会搜集她的兴趣、爱好、星座、闺密、乃至三围。
等等各种信息吧,然后想自己怎么能搭讪上、约出来,碰壁了会继续找原因、想办法,这里面你都有在做数据分析呀。
@CIVN可视化社区:从你每天发的微博研究你喜欢哪个明星、是哪个星座的、喜欢吃什么买什么、大概几岁会嫁出去。
最IT的数据分析:@穆浩然:所以我一般都说我是做IT的。
@YicoLeung:复制粘贴。
@仓鼠_茄子把:你应该对男的低调说自己是码农,对女的高调说自己是分析师!现在甭管是什么职业,加个师字就显得特牛B,比如策划师,揉奶师,面包师,搬砖师等等。
最实用的数据分析:@ETwise:我告诉别人:你买了牙膏我还会推荐你买牙刷,我就是做这样的工作的。
@老仲琢磨:可以知道刚当爹的男人买尿布时最可能顺便买点啥。
@张勇往前行:每个月月底,老婆问你,这个月的钱你是怎么花的?你的回答就是数据分析。
最神化的数据分析:@张启仁:数据分析是算命的。
最霸气的数据分析:@淘货郎:数据分析就是企业的军统和中统。
@牧羊人_DM:这是一个很有前途特牛B的职业,具体细节你没必要知道。
最恐怖的数据分析:@游走的背包:数据分析就是文革时的查人祖上三代,最后定义你这代什么成份!@宝泥马冷死了:从你爸的日常行为统计中推测你下次考试不及格他会用什么东西揍你。
那到底什么是数据分析呢?说说数据哥的理解:数据分析是基于商业目的,有目的的进行收集、整理、加工和分析数据,提炼有价信息的一个过程。
其过程概括起来主要包括:明确分析目的与框架、数据收集、数据处理、数据分析、数据展现和撰写报告等6个阶段。
1、明确分析目的与框架一个分析项目,你的数据对象是谁?商业目的是什么?要解决什么业务问题?数据分析师对这些都要了然于心。
基于商业的理解,整理分析框架和分析思路。
例如,减少新客户的流失、优化活动效果、提高客户响应率等等。
不同的项目对数据的要求,使用的分析手段也是不一样的。
2、数据收集数据收集是按照确定的数据分析和框架内容,有目的的收集、整合相关数据的一个过程,它是数据分析的一个基础。
3、数据处理数据处理是指对收集到的数据进行加工、整理,以便开展数据分析,它是数据分析前必不可少的阶段。
这个过程是数据分析整个过程中最占据时间的,也在一定程度上取决于数据仓库的搭建和数据质量的保证。
数据处理主要包括数据清洗、数据转化等处理方法。
4、数据分析数据分析是指通过分析手段、方法和技巧对准备好的数据进行探索、分析,从中发现因果关系、内部联系和业务规律,为商业目提供决策参考。
到了这个阶段,要能驾驭数据、开展数据分析,就要涉及到工具和方法的使用。
其一要熟悉常规数据分析方法,最基本的要了解例如方差、回归、因子、聚类、分类、时间序列等多元和数据分析方法的原理、使用范围、优缺点和结果的解释;其二是熟悉1+1种数据分析工具,Excel是最常见,一般的数据分析我们可以通过Excel完成,后而要熟悉一个专业的分析软件,如数据分析工具SPSS/SAS/R/Matlab等,便于进行一些专业的统计分析、数据建模等。
5、数据展现一般情况下,数据分析的结果都是通过图、表的方式来呈现,俗话说:字不如表,表不如图。
借助数据展现手段,能更直观的让数据分析师表述想要呈现的信息、观点和建议。
常用的图表包括饼图、折线图、柱形图/条形图、散点图、雷达图等、金字塔图、矩阵图、漏斗图、帕雷托图等。
6、撰写报告最后阶段,就是撰写数据分析报告,这是对整个数据分析成果的一个呈现。
通过分析报告,把数据分析的目的、过程、结果及方案完整呈现出来,以供商业目的提供参考。
一份好的数据分析报告,首先需要有一个好的分析框架,并且图文并茂,层次明晰,能够让阅读者一目了然。
结构清晰、主次分明可以使阅读者正确理解报告内容;图文并茂,可以令数据更加生动活泼,提高视觉冲击力,有助于阅读者更形象、直观地看清楚问题和结论,从而产生思考。
另外,数据分析报告需要有明确的结论、建议和解决方案,不仅仅是找出问题,后者是更重要的,否则称不上好的分析,同时也失去了报告的意义,数据的初衷就是为解决一个商业目的才进行的分析,不能舍本求末。
二、如何用数据光知道怎么看数据,还是不成,你得熟悉这些数据拿到手上之后怎么去用它,怎么让数据显示出来它本身的威力来。
最后总结下来有这么几个部分。
第一个部分,是看历史数据,发现规律。
以社区中的活动和电商中的促销为例,这些都是常见的活动,活动做得好的话有意想不到的效果。
在做这样的活动,最好是拿到前一个月或者两个月的历史数据。
对电商来说,从这里面要去分析各个品类的销售情况,那个品类销量最大,那个品类销量最小,每月或者每周的平均增长率和符合增长率是多少。
通过原始数据把上面的这些指标分析出来之后,就可以看到哪些品类是优势品类,不用促销就可有很大的量,哪些是弱势的品类等等,这样可以确定出来拿那个品类出来做促销。
对于内容社区也是一样,我们要从内容分类,和内容类型两个维度上去看,找到数量少类型单一的分类,对于这些分类下的内容数量及质量都需要提高。
第二部分,是从历史数据和现有数据中,发现端倪,找出问题所在。
我们在工作中,每天都会接触到大量的数据,但是大部分看数据就流于表面了。
例如对于社区来说,很关注总注册用户数,每日登录用户数,每日新用户注册数。
这些数据不能说不可以看,但是更要看到最重要的数据点:每天有多少老用户登录、每天发布的内容中有多少能够称得上是优质的精品内容,这两个数据决定着说这个社区的质量怎么样,对于内容社区来说,初期如果不重视质量建设,那么等用户到50W、100W之后再去看质量,已经有点晚了。
还有一个是市场部门用的会很多,在市场宣传过程中,我们会有很多广告和链接放出去,每天要监测这些链接数据量,当出现数据波动非常大的时候我们应该怎么去做,是要看到链接放置的媒体出现了问题,是不是对方做活动突然吸引了大量的人来,还要去看到我们的着陆页面,是不是吸引用户点击等等。
数据就是我们的助手,帮助我们发现问题,同时顺藤摸瓜找到问题的根源所在。
这个能力是非常重要的,不管是不是做数据相关工作的人,都要能够掌握。
第三部分,数据预测。
通过分析数据,发现其中的规律,那么则可实现数据驱动运营,驱动产品,驱动市场。
例如,对电商来说,知道一年内每个月的各个品类的增长率,也清楚各月之间的影响情况,那么按照这个量就可预测未来月度里面交易量的增长情况,我们能够达到什么样的水平。
同时,在某个大型活动完结之后,不是立即看数据,要看活动结束后一个月后的数据,这样才能看到多少用户是因为活动的奖品过来,活动结束之后就走了,为什么选一个月,因为在一个月内流失率什么的就一目了然了。
第四部分,学会拆解数据。
这个拆解数据在我看来有两方面的维度一个是每年的数据指标怎么去分拆到每个季度,或者每个月,这个有点绩效驱动的意思了。
另外一个就是说每天产品的运营数据,推广数据或者销售数据有很多,要会对这些数据进行拆分,知道每个数据都是来自哪些方面,增高或者降低的趋势是什么。
近几年数据分析在互联网领域非常受到重视,无论是社区型产品,工具类产品,还是电子商务,都越来越把数据作为核心资产。
确实数据分析的越深,越能够是在精细化的运营,在很多时候工作的重点才有据可依。
但是要注意两方面的问题:1,不能唯数据论,数据有时候能够反馈一些问题,但是也要注意到在有些时候数据并不能说明所有问题,也需要综合各方面的情况整体来看。
同时要有数据分析的思维,不仅仅是互联网行业几乎所有的行业每天都会产生大量的数据。
所以最重要的是有这种数据粉丝的思维,知道怎么通过数据分析找出规律,发现问题,对将来做出预测及拆解。
2、找到适合自己产品的数据指标来。
不同的产品特性,用户使用习惯也都不一样的,需要找到适合自己产品的指标参数而不是随大流,不是简单的PV、UV就可以了。
例如对于内容型产品来说,每天的PV,UV是一个非常重要的指标。
对于社区型网站来说,每天的登陆数据和进行有效操作的用户则是需要关注的。
而对于电子商务网站来说,订单数及客单价是核心,但是于此同事转化率和重复购买率则是需要同样关注的。
在移动互联网上这种的数据参数更是多样,最重要的是我们要学会通过自己用户行为特征来找出界定产品健康程度的标准,这样能让我们更好地观察自己产品的好坏。
三、在数据分析、挖掘方面,有哪些好书值得推荐(43本全)入门读物:1. 深入浅出数据分析,这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了R是大加分。
难易程度:非常易。
2. 啤酒与尿布,通过案例来说事情,而且是最经典的例子。
难易程度:非常易。
3. 数据之美,一本介绍性的书籍,每章都解决一个具体的问题,甚至还有代码,对理解数据分析的应用领域和做法非常有帮助。
难易程度:易。
4.谁说菜鸟不会数据分析,其实EXCEL在工作中还是大杀器,原因是易传承,好传播5. "数据分析:企业的贤内助",读起来有乐趣,案例比较分许,适合初学者中级篇:数据分析、挖掘与工具应用1. SciPy and NumPy,这本书可以归类为数据分析书吧,因为numpy和scipy真的是非常强大啊。
2. Python for Data Analysis,作者是Pandas这个包的作者,看过他在Scipy会议上的演讲,实例非常强!3. Bad Data Handbook,很好玩的书,作者的角度很不同。
4.《New Internet:大数据挖掘》——是MS的一位资深专家写的,从算法到工具,再到DM在日志分析、营销邮件、电商、移动等业务中的实际应用,内容有较全面的介绍,语言浅显易懂,作DM领域进门读物很不错。
并且在每章节后都有提供本章提到的工具或数据来源,方便学习。