当前位置:文档之家› 大数据分析师·人才培养计划·筑梦起航

大数据分析师·人才培养计划·筑梦起航

一、大数据分析师时代背景随着计算机和信息技术的迅猛发展和普及应用,行业应用系统的规模迅速扩大,行业应用所产生的数据呈爆炸性增长。

动辄达到数百TB甚至数十至数百PB规模的行业/企业大数据已远远超出了现有传统的计算技术和信息系统的处理能力,因此,寻求有效的大数据处理技术、方法和手段已经成为现实世界的迫切需求。

由于大数据处理需求的迫切性和重要性,近年来大数据技术已经在全球学术界、工业界和各国政府得到高度关注和重视,全球掀起了一个可与20世纪90年代的信息高速公路相提并论的研究热潮。

美国和欧洲一些发达国家政府都从国家科技战略层面提出了一系列的大数据技术研发计划,以推动政府机构、重大行业、学术界和工业界对大数据技术的探索研究和应用。

目前,国内外IT企业对大数据技术人才的需求正快速增长,未来5~10年内业界将需要大量的掌握大数据处理技术的人才。

为了紧跟全球大数据技术发展的浪潮,我国政府、学术界和工业界对大数据也予以了高度的关注。

国务院《关于印发促进大数据发展行动纲要的通知》发布,大数据已上升为国家战略。

数据驱动的大数据时代到来了,你准备好了吗?正所谓机不可失,失不再来!只有站在时代的前列,你才会更具竞争力!二、大数据就业方向根据16年数联寻英发布的首份《大数据人才报告》,目前全国的大数据人才经济46万,未来3-5年大数据人才的缺口将高达150万,随着缺口逐渐放大,大数据人才的薪资将会水涨船高。

大数据的应用也会逐渐在行业中扩散开来,由金融、通信、电商行业逐渐应用到其他领域。

中国大数据市场正处于高速发展期根据易观的报告能够发现目前已经处在大数据市场高速发展的尾巴,企业深度利用数据价值的意识迅速提高,数据资产管理成为热门概念,企业开始愿意通过数据交易进行变现,各种与大数据有关的政策及法律法规不断完善,市场成熟后,入行门槛恐怕会相应提高,现在抓住最后进入大数据市场的机会非常重要,一个人的选择有时候比努力更重要。

首先大数据人才主要分为大数据架构和大数据分析这2个大的模块。

其中大数据架构主要就是深入各个公司,为公司搭建大数据平台,并提供日常运维工作。

大数据分析涉及的就会相对广一些,有大数据可视化、大数据预测、咨询、产品的大数据分析。

在有了丰富数据之后,如何从中得到洞察。

因而可以预见,分析人员的部分工作将会越来越自动化,从而可以极大提高生产力。

同时,应用于营销、应用监测等方向的 BI 平台日趋多样,也带动了大数据分析的不断完善。

2015年大数据还主要集中在金融、通信、零售三大行业,经过这几年的发展,在互联网、电商行业也开枝散叶蓬勃发展。

从线上零售行业来说,他们的产业链如下:在线上零售业中,在线电子商务平台会整合交易信息和购物信息形成自身的电商大数据,从而进行用户营销信息的深度挖掘,包括消费金融信息、消费者信用信息、消费者精准画像、电商赢利模式创新等。

而目前大量在线电子商务平台或自行开发,或与领先的大数据处理方案提供商合作,高效地处理平台数据。

大数据在金融行业中主要是在三个方面的应用银行业、保险业、证券业。

总的来看银行大数据引用分为四大方面:客户画像应用,主要分为个人客户画像和企业客户画像;精准营销,包括实时营销、交叉营销、个性化推荐、客户生命周期管理等;风险管控,包括中小企业贷款风险评估和欺诈交易识别等手段;运营优化,如市场和渠道分析、产品和服务、舆情分析等方面的优化;保险行业主要可以分为三大方面:客户细分及精细化营销、欺诈行为分析和精细化运营。

客户细分及精细化营销包括客户细分和差异化服务、潜在客户挖掘及流失用户预测、客户关联销售、客户精准营销。

常见的预测和分析欺诈、等非法行为包括医疗保险欺诈与滥用分析以及车险欺诈分析等。

精细化运营包括产品优化、运营分析、代理人(保险销售人员)甄选等;相对于银行和保险业,证券行业的大数据应用起步相对较晚。

目前国内外证券行业的大数据应用大致有以下三个方向:股价预测、客户关系管理、投资景气指数。

从上面的几个大数据的应用可以看出,大数据分析人员的工作集中在做客户画像、然后推荐产品促进消费从而提高营业额、还有就是做一些风险管理,和市场预测。

二、大数据工程师薪资水平通过招聘网站职友集,它是一个专注于为用户提供便捷职业信息搜索平台可以发现来自全国的近1年的906份用户提交的样本中发现大数据分析工程师薪资水平的全国平均工资在170,00左右,其中80%的薪资水平在100,00以上,其中薪资主要集中在20K-30K之间。

如果按照工作经验统计,可以看到大数据分析工程师的薪资水平也是逐年递增,经验越是丰富,薪资水平也会越高,应届毕业生薪资水平也接近100,00在应届生中属于顶尖水平。

根据招聘网站招聘条件分析:招聘待遇,工资6000-7999占比最多,达31%。

经验要求,3-5年工作经验要求的占比最多,达53%;学历要求,本科学历要求的占比最多,达49%。

三、课程体系课程以大数据分析师为目标,从数据分析基础、linux操作系统入门知识学起,系统介绍Hadoop、HDFS、MapReduce和Hbase等理论知识和Hadoop的生态环境,详细演示Hadoop平台的安装配置,通过python详解各类数据挖掘算法的实现与调优。

区别于普通的程序员,本课程的重点是培养基于Hadoop架构的大数据分析思想及架构设计,通过演示实际的大数据分析案例,使学员能在较短的时间内理解大数据分析的真实价值,掌握如何使用Hadoop架构应用于大数据分析过程,使学员能有一个快速提升成为兼有理论和实战的大数据分析师,从而更好地适应当前互联网经济背景下对大数据分析师需求的旺盛的就业形势。

从入门知识学起的课程体系设计和面向大数据分析师的培训理念,引导学员一步步深入学习,适合零基础学员从零学起。

Hadoop大数据分析课程给你的就是把握时代脉博,掌握大数据时代前沿;全面掌握Hadoop的架构原理和使用场景;全面掌握Hadoop的三种架构方式及搭建过程;熟练掌握HDFS文件系统与MapReduce程序开发思想;能利用Hadoop平台进行大数据分析;能深入实际的项目案例进行大数据的实战开发;达到大数据分析师的理论和实战要求。

课程一数据库基础课程简介:数据库的查询语句是每个数据分析师必须掌握的技能,通过数据库阶段的课程使学员掌握数据库的使用。

本课程讲介绍了数据库的库管理,表管理等基础操作以及应对各种复杂情况下的查询语句, ER图的使用让学员对数据库中各表的关系有了更为清晰的思路,通过案例让学员对数据库的使用有更充分的理解。

通过本阶段的学习学员能够达到使用数据库对数据进行整理及清洗,能够在复杂的表中获取需要的数据。

课程内容:1.数据库设计概述2.ER图3.MySQL数据库安装和配置4.MySQL数据库管理5.MySQL表管理课程二6.表的更新7.表的查询(正则表达式与连接查询)8.MYSQL综合案例课程二 Java编程基础课程简介:本阶段重点学习Java编程和面向对象知识,让初学者体会到编程的乐趣,为后面的大数据平台技术打好基础,因为Hadoop平台基于Java开发的,学会Java基础知识是必要的。

课程内容:1.Java编程语言的主要特性,Java虚拟机的主要功能2.面向对象基础,重载方法名称,构造并初始化对象3.子类,覆盖方法,调用覆盖方法,调用父类构造函数4.类(static)变量,类(static)方法,静态初始化程序5.一个完整的例子,关键字final,抽象类,接口6.异常:java语言的异常,异常处理,异常分类,共同异常课程三数学及统计学基础课程简介:本阶段包括数学与统计学两个阶段。

线性代数与分积分是统计学的基础。

统计学部分包括最基础的统计理论(描述性统计、区间估计、假设检验等),到基本的统计分析(T检验、方差分析等),最后到常用列连分析、相关分析等。

以深入浅出的方法,带大家逐步了解统计。

课程内容:1. 线性代数基础2. 微积分基础3. 描述性统计(均值、中位数、集中趋势等)4. 抽样估计5. 假设检验(T检验、F检验、卡方检验)6. 方差分析7. 列联分析、相关分析课程四 Python编程知识【1】Python基础编程课程简介:Python是基于C的一种面向对象、解释型计算机程序设计语言。

近几年来Python在数据分析领域逐渐占据了统治地位,成为了名副其实的Number one。

本课程主要是带大家了解Python的基础语言部分,了解基础的Python特性。

其强大的数据处理包Pandas可以高效的完成前期数据清洗工作。

课程内容:1. Python语言的介绍、基本语法、基础数据类型。

2. Python基础数据结构、控制流语句。

3.数据管理4. Python的IO和异常处理5. Python函数和模块。

【2】Pandas应用课程简介:Pandas包是非常高效的处理清洗数据的包,基于numpy。

本部分主要是给大家介绍pandas的实际应用中常用的内容。

课程内容:1. Python包的安装管理、Numpy数组、Pandas索引对象2. Pandas数据结构、统计描述、缺失值处理和常用函数3. Python结构化数据和非结构化数据清洗课程五数据挖掘算法详解及Python实现课程简介:本阶段内容为数据挖掘各类算法,每种算法进行单独的详细讲解并通过python进行实现。

在本阶段的课程结束后,学员能够达到了解常见算法的实现并能够进行优化,使模型更加契合实际情况中的需求。

课程内容:1. 线性回归原理及Python实现2. 逻辑回归原理及Python实现3. 时间序列原理及Python实现4. 朴素贝叶斯、KNN原理及Python实现5. 决策树原理及Python实现6. 集成学习原理及Python实现7. 随机森林原理及Python实现8. 支持向量机原理及Python实现9. 神经网络原理及Python实现10. 关联规则,协同过滤原理及Python实现11.文本挖掘原理及Python实现课程六可视化工具之python实现课程简介:大数据分析离不开展示工具,本课程为大家讲解如今使用度相对较高的、功能相对完善的python工具,通过学习本课程学员可以相似学习其他BI工具操作。

课程内容:1.Python介绍及可视化操作2.视图创建和仪表板设计3.可视化动态数据分析课程七大数据环境搭建课程简介:本课程介绍了Hadoop的发展、整体架构及Hdfs分布式存储、MapReduce分布式计算框架,使学员对Hadoop平台有一个系统的了解,能够将Hive,Sqoop,Hbase等基于Hadoop平台的组件安装运行。

课程内容:1. Hadoop安装配置2.MapReduce安装配置3.Hive介绍安装配置4. Hbase介绍安装配置5.Sqoop安装配置6.Scala和Spark安装配置课程八大数据仓库Hive课程简介:Hive是Hadoop的一个数据仓库工具,它可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能,将SQL语句转化为MapReduce任务进行运作。

相关主题