班级规模及环境--热线:4008699035 手机:15921673576( 微信同号) |
每期人数限3到5人。 |
上课时间和地点 |
上课地点:【上海】:同济大学(沪西)/新城金郡商务楼(11号线白银路站) 【深圳分部】:电影大厦(地铁一号线大剧院站)/深圳大学成教院 【北京分部】:北京中山学院/福鑫大楼 【南京分部】:金港大厦(和燕路) 【武汉分部】:佳源大厦(高新二路) 【成都分部】:领馆区1号(中和大道) 【沈阳分部】:沈阳理工大学/六宅臻品 【郑州分部】:郑州大学/锦华大厦 【石家庄分部】:河北科技大学/瑞景大厦 【广州分部】:广粮大厦 【西安分部】:协同大厦
最近开课时间(周末班/连续班/晚班):2020年3月16日 |
实验设备 |
☆资深工程师授课
☆注重质量
☆边讲边练
☆合格学员免费推荐工作
★实验设备请点击这儿查看★ |
质量保障 |
1、培训过程中,如有部分内容理解不透或消化不好,可免费在以后培训班中重听;
2、培训结束后,授课老师留给学员联系方式,保障培训效果,免费提供课后技术支持。
3、培训合格学员可享受免费推荐就业机会。 |
课程大纲 |
|
大数据培训日程 课程目标: 通过该课程的学习,会对大数据离线计算、实时计算的企业级构架有清晰的理解以及对常用的成熟的大数据开源项目从原理到使用有深入的理解。 实时计算的项目常用组合为Flume(数据采集) + Kafka(高可用高并发分布式消息队列) + spark streaming(流式计算) + hbase(分布式列式存储数据库,亿级行百万列毫秒级查询) 离线计算项目常用组合为分布式文件存储HDFS,资源调度器、分布式计算框架MapReduce、数据仓库Hive。 课程大纲: 时间 主题 内容 第一天 上午 离线计算: Hadoop大数据生态圈、分布式存储HDFS、资源管理 大数据生态圈介绍 开源相关项目说明以及每个项目的用途 实时计算整体构架详解 离线计算整体构架详解 分布式文件系统HDFS是什么 HDFS的体系结构 HDFS高可用集群原理详解 HDFS如何使用 资源管理器介绍以及构架 资源管理器核心组件详解 资源调度器详解 下午 离线计算: Hadoop MapReduce&Hive 分布式计算MapReduce介绍 MapReduce整体流程 MapReduce实例 数据仓库工具Hive介绍 Hive模型介绍:数据库、表、分区、高级函数 Hive元数据介绍 第二天 上午 实时计算: 数据采集Flume、分布式消息队列Kafka 实时计算整体构架设计 Flume是什么以及体系结构介绍 Flume组件介绍:agent、source、channel、sink Flume高可用拓扑介绍 Kafka体系结构详解 Kafka核心概念 Kafka高可用高并发原理 Kafka生产者消费者 Flume写入kafka 下午 实时计算: spark streaming流式计算、HBase分布式列存储 spark是什么以及体系结构 弹性分布式数据集RDD spark streaming流式计算体系结构 spark steaming读取kafka spark算子详解 HBase存储数据库体系结构 Hbase的高可用 HBase数据模型详解 HBase毫秒级查询
|
|