曙海教育集团
全国报名免费热线:4008699035 微信:shuhaipeixun
或15921673576(微信同号) QQ:1299983702
首页 课程表 在线聊 报名 讲师 品牌 QQ聊 活动 就业
  fo  
 
 
   班级规模及环境--热线:4008699035 手机:15921673576( 微信同号)
       每期人数限3到5人。
   上课时间和地点
上课地点:【上海】:同济大学(沪西)/新城金郡商务楼(11号线白银路站) 【深圳分部】:电影大厦(地铁一号线大剧院站)/深圳大学成教院 【北京分部】:北京中山学院/福鑫大楼 【南京分部】:金港大厦(和燕路) 【武汉分部】:佳源大厦(高新二路) 【成都分部】:领馆区1号(中和大道) 【沈阳分部】:沈阳理工大学/六宅臻品 【郑州分部】:郑州大学/锦华大厦 【石家庄分部】:河北科技大学/瑞景大厦 【广州分部】:广粮大厦 【西安分部】:协同大厦
最近开课时间(周末班/连续班/晚班):2020年3月16日
   实验设备
     ☆资深工程师授课
        
        ☆注重质量 ☆边讲边练

        ☆合格学员免费推荐工作
        ★实验设备请点击这儿查看★
   质量保障

        1、培训过程中,如有部分内容理解不透或消化不好,可免费在以后培训班中重听;
        2、培训结束后,授课老师留给学员联系方式,保障培训效果,免费提供课后技术支持。
        3、培训合格学员可享受免费推荐就业机会。

课程大纲
 

数据Hadoop最佳实践培训

培训内容

第一部分

第1个主题:Hadoop思考

1.Hadoop的设计目标和适用场景

2.Hadoop架构解析

3.MapReduce工作原理和案例说明

第2个主题:Hadoop集群与管理

1、 Hadoop集群的搭建

2、 Hadoop集群的监控

3、 Hadoop集群的管理

4、 集群下运行MapReduce程序

第3主题:彻底掌握HDFS (具备修改HDFS具体源码实现的能力)

1、HDFS体系架构剖析

2、NameNode、DataNode、SecondaryNameNode架构

3、保证NodeName高可靠性最佳实践

4、DataNode中Block划分的原理和具体存储方式

5、修改Namenode、DataNode数据存储位置

6、使用CLI操作HDFS

7、使用Java操作HDFS

第4主题:彻底掌握HDFS (具备修改HDFS具体源码实现的能力)

1、RPC架构剖析

2、源码剖析Hadoop构建于RPC之上

3、源码剖析HDFS的RPC实现

4、源码剖析客户端与与NameNode的RPC通信

第5个主题:彻底掌握MapReduce(从代码的角度剖析MapReduce执行的具体过程并具备开发MapReduce代码的能力)

1、MapReduce执行的经典步骤

2、wordcount运行过程解析

3、Mapper和Reducer剖析

4、自定义Writable

5、新旧API的区别以及如何使用就API

6、把MapReduce程序打包成Jar包并在命令行运行

第6个主题:彻底掌握MapReduce(具备掌握Hadoop如何把HDFS文件转化为Key-Value让供Map调用的能力)

1、 Hadoop是如何把HDFS文件转化为键值对的?

2、 源码剖析Hadoop读取HDFS文件并转化为键值对的过程实现

3、 源码剖析转化为键值对后供Map调用的过程实现

第7个主题:彻底掌握MapReduce(具备掌握MapReduce内部运行和实现细节并改造MapReduce的能力)

1、 Hadoop内置计数器及如何自定义计数器

2、 Combiner具体的作用和使用以及其使用的限制条件

3、 Partitioner的使用最佳实践

4、 Hadoop内置的排序算法剖析

5、 自定义排序算法

6、 Hadoop内置的分组算法

7、 自定义分组算法

8、 MapReduce常见场景和算法实现

第二部分

第1个主题:HBase架构设计和实现剖析

1、 HBase定义

2、 HBase与RDBMS的对比

3、 数据模型

4、 系统架构

5、 HBase上的MapReduce

6、 表的设计

第2个主题:HBase集群及其管理

1、 集群的搭建过程讲解

2、 集群的监控

3、 集群的管理

第3个主题:HBase客户端

1、 HBase Shell以及演示

2、 Java客户端以及代码演示

第4个主题:HBase案例实战1---使用HBase实现微博系统

1. 项目架构和设计

2. 开发环境搭建

3. 实现用户登录和注销

4.“关注”功能的设计和实现

5.“发微博”功能的设计和实现

6.发布和运行整个基于HBase的微博系统

第5个主题:HBase与MapReduce

1. HBase与MapReduce的关系

2. HBase如何使用MapReduce

第6个主题:HBase案例实战2---话单查询与统计

1. 项目架构设计

2. 开发环境搭建

3. 话单入库和查询的设计与实现

4.统计功能的设计与实现

第7个主题:安装和使用Hive

1. Hive剖析

2. 安装Hive

3.Hive的基本使用

第8个主题:Hive与HDFS、MapReduce

1. Hive向HDFS存入结构化数据

2. 使用MySQL作为Hive的元数据库

3.Hive与MapReduce

第三部分

第1个主题:Hive

1. Hive的Java扩展开发

2. Hive UDF和UDAF开发

3. Hive常见场景,实战练习

第2个主题:Hive案例实战---数据统计

1. 项目架构设计

2. 表结构设计

3.数据的插入与统计实现

第3个主题:Sqoop

1. Sqoop原理

2. Sqoop使用详解

3. 用Sqoop实现HDFS/Hive与关系数据库的数据交互

4. 用Sqoop实现HBase与关系数据库的数据交互

第4个主题:电商业日志流量分析项目

电商业日志流量分析项目,互联网企业对海量日志的分析是Hadoop应用的一个重要用途,也是对网站流量、客户行为分析的重要途径。该项目整合Hive、Hbase、Sqoop等常用组件,涉及从后台处理到前台呈现的每一个技术环节。包括:

1·业务需求介绍

2·数据建模

3·后台算法设计

4·后台业务处理

5·前台WEB展示等

第5个主题:Hadoop开发者之路

1. Hadoop技能模型

2. Hadoop开发者最佳学习路线和方式

3.Hadoop开发者最佳成长路线




端海教育实验设备


android开发板
linux_android开发板
fpga图像处理
端海培训实验设备
fpga培训班
 
本课程部分实验室实景
端海实验室
实验室
端海培训优势
 
  备案号:备案号:沪ICP备08026168号-1 .(2024年07月24日)....................
友情链接:Cadence培训 ICEPAK培训 EMC培训 电磁兼容培训 sas容培训 罗克韦尔PLC培训 欧姆龙PLC培训 PLC培训 三菱PLC培训 西门子PLC培训 dcs培训 横河dcs培训 艾默生培训 robot CAD培训 eplan培训 dcs培训 电路板设计培训 浙大dcs培训 PCB设计培训 adams培训 fluent培训系列课程 培训机构课程短期培训系列课程培训机构 长期课程列表实践课程高级课程学校培训机构周末班培训 南京 NS3培训 OpenGL培训 FPGA培训 PCIE培训 MTK培训 Cortex训 Arduino培训 单片机培训 EMC培训 信号完整性培训 电源设计培训 电机控制培训 LabVIEW培训 OPENCV培训 集成电路培训 UVM验证培训 VxWorks培训 CST培训 PLC培训 Python培训 ANSYS培训 VB语言培训 HFSS培训 SAS培训 Ansys培训 短期培训系列课程培训机构 长期课程列表实践课程高级课程学校培训机构周末班 端海 教育 企业 学院 培训课程 系列班 长期课程列表实践课程高级课程学校培训机构周末班 短期培训系列课程培训机构 端海教育企业学院培训课程 系列班