Hadoop大数据平台架构与实践--基础篇
大数据时代已经到来,越来越多的行业面临着大量数据需要存储以及分析的挑战。
Hadoop,作为一个开源的分布式并行处理平台,以其高扩展、高效率、高可靠等优点,得到越来越广泛的应用。
本课旨在培养理解Hadoop的架构设计以及掌握Hadoop的运用能力。
导师简介
Kit_Ren,博士,某高校副教授,实战经验丰富,曾担任过大型互联网公司的技术顾问,目前与几位志同道合的好友共同创业,开发大数据平台。
课程须知
本课程需要童鞋们提前掌握Linux的操作以及Java开发的相关知识。
对相关内容不熟悉的童鞋,可以先去《Linux达人养成计划Ⅰ》以及《Java入门第一季》进行修炼~~
你能学到什么?
1、Google的大数据技术
2、Hadoop的架构设计
3、Hadoop的使用
4、Hadoop的配置与管理
大纲一览
第1章初识Hadoop
本章讲述课程大纲,授课内容,授课目标、预备知识等等,介绍Hadoop的前世今生,功能与优势
第2章 Hadoop安装
本章通过案例的方式,介绍Hadoop的安装过程,以及如何管理和配置Hadoop
第3章 Hadoop的核心-HDFS简介
本章重点讲解Hadoop的组成部分HDFS的体系结构、读写流程,系统特点和HDFS
的使用。
第4章 Hadoop的核心-MapReduce原理与实现
本章介绍MapReduce的原理,MapReduce的运行流程,最后介绍一个经典的示例WordCount
第5章开发Hadoop应用程序
本章介绍在Hadoop下开发应用程序,涉及多个典型应用,包括数据去重,数据排序和字符串查找。
课程地址:/view/391。