曙海教育集团
全国报名免费热线:4008699035 微信:shuhaipeixun
或15921673576(微信同号) QQ:1299983702
首页 课程表 在线聊 报名 讲师 品牌 QQ聊 活动 就业
           Hadoop大数据分析高级培训班
   班级规模及环境--热线:4008699035 手机:15921673576( 微信同号)
       每期人数限3到5人。
   上课时间和地点
上课地点:【上海】:同济大学(沪西)/新城金郡商务楼(11号线白银路站) 【深圳分部】:电影大厦(地铁一号线大剧院站)/深圳大学成教院 【北京分部】:北京中山学院/福鑫大楼 【南京分部】:金港大厦(和燕路) 【武汉分部】:佳源大厦(高新二路) 【成都分部】:领馆区1号(中和大道) 【沈阳分部】:沈阳理工大学/六宅臻品 【郑州分部】:郑州大学/锦华大厦 【石家庄分部】:河北科技大学/瑞景大厦 【广州分部】:广粮大厦 【西安分部】:协同大厦
最近开课时间(周末班/连续班/晚班)
Hadoop大数据开课时间:2020年3月16日
   实验设备
     ☆资深工程师授课

        
        ☆注重质量
        ☆边讲边练

        ☆合格学员免费推荐工作

        ☆合格学员免费颁发相关工程师等资格证书,提升您的职业资质

        专注高端培训15年,端海提供的证书得到本行业的广泛认可,学员的能力
        得到大家的认同,受到用人单位的广泛赞誉。

        ★实验设备请点击这儿查看★
   最新优惠
       ◆请咨询客服。
   质量保障

        1、培训过程中,如有部分内容理解不透或消化不好,可免费在以后培训班中重听;
        2、培训结束后,授课老师留给学员联系方式,保障培训效果,免费提供课后技术支持。
        3、培训合格学员可享受免费推荐就业机会。

   课程进度安排
课程大纲

Hadoop大数据分析高级培训班

课程内容:

(一)基础理论部分
1.数据分析基础
(1)数据分析过程概述
(2)概率论与数据统计
(3)抽样估计与假设检验
(4)方差分析与回归分析

2.java基础
(1)JDK的安装配置,Java基本知识、数据类型以及基本语法
(2)Eclipse的编程入门
(3)面向对象的思想基本介绍,类、对象、接口、封装、继承
(4)Java的集合类——数组、Set、List、Map、Queue
(5)异常处理——Checked Exception、Unchecked Exception,如何通过异常信息捕获错误
(6)Java的垃圾回收机制以及多线程简介
(7)Java的文件操作、包的概念及如何打包
(8)数据库基础知识及SQL语法
(9)基于servlet技术的B/S应用开发及代码实现案例详解

3.linux基础
(1)linux的介绍
(2)Linux入门:选择合适的Linux发行版、如何安装Linux
(3)linux操作系统命令及使用命令编辑文件
(4)Linux下SSH命令使用方法详解

(二)hadoop理论课程
1.hadoop安装配置及运行机制解析
本节是大数据分析的环境搭建课程,属于操作型课程,主要讲述如何在linux单机上面安装hadoop的伪分布模式,在linux集群上面安装hadoop集群。对于不熟悉linux的同学,课程中会简单的讲解常用的linux命令。这两种是必须要掌握的。通过讲师手把手、面对面的交流,教会学员自己搭建一个真实的hadoop环境,在此环境下运行hadoop自带的小程序。主要内容包括:

(1)从google的三篇大数据论文说起
(2)Hadoop 概念、版本、历史
(3)Hadoop 伪分布及集群的详细安装步骤
(4)三个hadoop自带的小例子带你进入hadoop的世界
(5)使用如何通过命令行和浏览器观察hadoop的运行过程
(6)介绍hadoop的安全模式
(7)如何查看日志信息

2.Hadoop分布式文件系统深入剖析
本节将对hadoop架构的分布式文件系统HADFS进行深入的分析,hdfs是所有hadoop系统的基础,它是hadoop的核心内容之一。主要的内容包括:

(1)深度分析google的Google GFS 文件系统,一个面向大规模数据密集型应用的、可伸缩的分布式文件系统。
(2)HDFS的概念及设计
(3)Hdfs体系结构及运行机制详述
(4)NameNode、DataNode、SecondaryNameNode的作用及运行机制
(5)block 的划分原理、存储方式和配置文件
(6)hdfs的备份机制和文件管理机制
(7)HDFS文件系统的常用命令
(8)使用命令及JAVA语句操作hdfs中的文件
(9)rpc机制简介及HADFS中的rpc通信

3.MapReduce理论及实战
(1)深度分析google的MapReduce编程模型
(2)hadoop中的MapReduce工作原理
(3)通过演示单词计数程序,详细讲述mapreduce运行过程中类的调用过程
(4)详细讲述如何覆盖 Mapper 功能、如何覆盖 Reducer 功能。
(5)MapReduce job的生命周期中job提交、task分发和task执行
(6)MapReduce中block 的调度及作业分配机制
(7)讲解hadoop的计数器、排序、分组等算法
(8)通过一个小的应用,详细介绍如何在eclipse中编写MapReduce程序,打包成可在hadoop上运行的jar,并在集群上运行
(9)详细讲解运行结果的分析

4.hadoop生态环境介绍
(1)Hbase简介,包括HBase的基础概念 、数据模型、存储模型及hbase的伪分布和集群的安装
(2)ZooKeeper简介,包括ZooKeeper的安装、运行及示例
(3)Pig简介,包括Pig的安装、运行及示例
(4)Hive简介,包括Hive的安装、运行及示例
(5)sqoop简介,包括Sqoop介绍、命令、原理及流程
(6)nosql简介,包括nosql的概念、种类及发展趋势

(三)大数据分析思想、工具及实战案例
1.大数据分析思想介绍
(1)大数据分析的前世今生
(2)几种典型的大数据架构分析
(3)大数据分析过程描述
(4)大数据时代的数据分析思想的变革

2.Mahout,大数据分析的急先锋
Mahout 是 Apache SoftwareFoundation(ASF)旗下的一个开源项目,它通过和hadoop配合,实现在推荐、分类等领域中的大数据分析。
(1)Mahout的下载、安装与部署
(2)UCI经典数据集介绍
(3)使用经典数据集测试和运行Mahout实现的算法
(4)主要算法包括:kmeans算法、canopy算法、dirichlet 算法和meanshift算法

3.RHadoop,R语言从小数据分析到大数据分析的化丽转身
(1)R语言简介
(2)安装并运行RHadoop
(3)RHadoop的逻辑结构
(4)Rhadoop实战案例—word cout
(5)与hadoop word count 函数比较分析

4.大数据分析项目案例

版权所有:苏州端海信息科技有限公司

双休日、节假日及晚上可致电值班电话:4008699035 值班手机:15921673576(微信同号) 或加qq:1299983702和微信:shuhaipeixun


备案号:备案号:沪ICP备08026168号-1

友情链接:SOC设计培训 Labview培训 Matlab培训 DCS培训 OPENGL培训 DCS培训 OPENCV培训 Labview培训 Cortex培训 SOC培训
友情链接:Cadence培训 ICEPAK培训 EMC培训 电磁兼容培训 sas容培训 罗克韦尔PLC培训 欧姆龙PLC培训 PLC培训 三菱PLC培训 西门子PLC培训 dcs培训 横河dcs培训 艾默生培训 robot CAD培训 eplan培训 dcs培训 电路板设计培训 浙大dcs培训 PCB设计培训 adams培训 fluent培训系列课程 培训机构课程短期培训系列课程培训机构 长期课程列表实践课程高级课程学校培训机构周末班培训 南京 短期培训系列课程培训机构 长期课程列表实践课程高级课程学校培训机构周末班 端海 教育 企业 学院 培训课程 系列班 长期课程列表实践课程高级课程学校培训机构周末班 短期培训系列课程培训机构 端海教育企业学院培训课程 系列班