大数据技术原理与应用培训
第1章 大数据概述
1.1大数据时代
1.2大数据的概念和影响
1.3大数据的应用
1.4大数据的关键技术
1.5 大数据与云计算、物联网的关系
第1章 大数据概述 单元测验
第2章 大数据处理架构Hadoop
2.1Hadoop简介和版本演变
2.2Hadoop项目结构
2.3Linux和Hadoop的安装
2.4Hadoop集群的部署和使用
第2章 大数据处理架构Hadoop 单元测验
第3章 分布式文件系统HDFS
3.1 分布式文件系统HDFS简介
3.2 HDFS相关概念
3.3 HDFS体系结构
3.4 HDFS存储原理
3.5 HDFS数据读写
3.6 HDFS编程实践
第3章 分布式文件系统HDFS 单元测验
第4章 分布式数据库HBase
4.1 HBase简介
4.2 HBase数据模型
4.3 HBase的实现原理
4.4 HBase运行机制
4.5 HBase应用方案
4.6 HBase的安装和编程实践
第4章 分布式数据库HBase单元测验
第5章 NoSQL数据库
5.1 NoSQL数据库
5.2 NoSQL与关系数据库的比较
5.3 四大类型NoSQL数据库
5.4 NoSQL数据库的理论基石
5.5 从NoSQL到NewSQL数据库
5.6 文档数据库MongoDB
第5章 NoSQL数据库 单元测验
第6章 云数据库
6.1 云数据库概述
6.2 云数据库产品
6.3 UMP系统
6.4 Amazon云数据库
6.5 微软云数据库SQL Azure
第6章 云数据库 单元测验
第7章 MapReduce
7.1 MapReduce简介
7.2 MapReduce的体系结构
7.3 MapReduce工作流程概述
7.4 Shuffle过程原理
7.5 MapReduce应用程序执行过程
7.6 实例分析:WordCount
7.7 MapReduce的具体应用
7.8 MapReduce编程实践
第7章 MapReduce 单元测验
第8章 Hadoop再探讨
8.1 Hadoop的优化与发展
8.2 HDFS HA和HDFS Federation
8.3 YARN
8.4 Hadoop生态系统中具有代表性的功能组件
第8章 Hadoop再探讨 单元测验
第9章 数据仓库Hive
9.1 数据仓库概念
9.2 Hive简介
9.3 SQL语句转换成MapReduce作业的基本原理
9.4 Impala
9.5 Hive的安装和基本操作
第9章 数据仓库Hive 单元测验
第10章 Spark
10.1 Spark简介
10.2 Spark生态系统
10.3 Spark运行架构
10.4 Spark SQL
10.5 Spark的部署和应用方式
10.6 Spark的安装和编程实践
第10章 Spark 单元测验
第11章 流计算
11.1 流计算概述
11.2 流计算处理流程
11.3 流计算的应用
11.4 开源流计算框架Storm
11.5 Spark Streaming、Samza以及三种流计算框架的比较
11.6 Storm的安装和编程实践
第11章 流计算 单元测验
第12章 Flink
12.1Flink简介
12.2为什么选择Flink
12.3Flink应用场景
12.4Flink技术栈、体系架构和编程模型
12.5Flink的安装和编程实践
第12章 Flink 单元测验
第13章 图计算
13.1 图计算简介
13.2 Pregel简介
13.3 Pregel图计算模型
13.4 Pregel的C++ API
13.5 Pregel的体系结构
13.6 Pregel的应用实例——单源短路径
13.7 Hama的安装和使用
第13章 图计算 单元测验
第14章 大数据在不同领域的应用
14.1大数据应用概览
14.2 大数据在互联网领域的应用——推荐系统
14.3 基于大数据的综合健康服务平台
第14章 大数据在不同领域的应用