通信人家园

标题: 关于上海Cloudera Hadoop大数据培训：CCAH、CCP：DE [查看完整版帖子] [打印本页]

时间: 2016-2-23 17:10

作者: souwin 标题: 关于上海Cloudera Hadoop大数据培训：CCAH、CCP：DE

北京、上海、广州长期开班

3月上海开班时间：管理员（3月1-4日）；开发者（3月23-26日）

【其他课程安排请咨询】15000519329(陈老师)

QQ群：Cloudera大数据 478790619

课程内容：

【Cloudera ApacheHadoop管理员课程】

课时：4天

学习系统管理的概念和Apache Hadoop的最佳实践，

从安装和配置到负载均衡和调优。

这个4天的的课程通过动手时间来赋予你部署的经验，

以及更多的安全方面的经验和故障排除。

课程结束后，学员被鼓励去参加Cloudera和Apache Hadoop管理员（CCAH）考试。

【课程内容】

1、Hadoop分布式文件系统（HDFS）

2、YARN/MapReduce的工作原理

3、如何优化Hadoop机群所需要的硬件配置

4、搭建Hadoop机群所需要考虑的网络因素

5、Hadoop机群维护和控制

6、如何利用Hadoop配置选项进行系统性能调优

7、如何利用FairScheduler为多用户提供服务级别保障

8、Hadoop机群维护和监控

9、如何使用Flume从动态生成的文件加载到Hadoop

10、如何使用Sqoop从关系型数据加载数据

11、Hadoop生态系统工具（如Hive、Impala、Pig和Base）

【学员基础】

具备基本Linux系统管理经验。不需要事先掌握Hadoop相关知识。

【授课形式】

案例教学+上机实践

【Cloudera Apache Hadoop程序员课程】

课时：4天

学习Hadoop分布式文件系统（HDFS）基础和MapReduce框架以及如何利用其API来编写程序，

讨论为更大型的工作流程而设计技术。

这门4天的课程涵盖了为MapReduce程序修复漏洞和优化性能所需的高级技巧。

程序员课程也引入了Apache生态项目比如Hive、Pig、HBase、Flume和Oozie。

【课程内容】

1、MapReduce与HDFS内核知识以及如何编写MapReduce程序

2、Hadoop开发的最佳实践，调试、实现工作流及通用算法

3、如何利用Hive、Pig、Sqoop、Flume、Oozie及其他Hadoop的组件

4、按需定制WritableComparables与InputFormats处理复杂的数据类型

5、利用MapReduce编写、执行连接操作以整合不同数据集合

6、用于现实世界数据分析所需的高级HadoopAPI主题

7、用Java写MapReduce程序，用Streaming写MapReduce程序

8、调试MapReduce代码的策略，利用localjobrunner在本地测试MapReduce代码

9、Partitioners和Reducers如何一起工作,定制化Partitioners

10、定制Writable和WritableComparable

11、用SequenceFile和Avro数据文件存储二进制数据

【学员基础】

该课程适合具有一定编程经验的程序开发人员。由于课程中需要完成Hadoop相关编程练习，熟悉Java者优先

【授课形式】

案例教学+上机实践

【Cloudera 数据分析课程】

课时：4天

针对任何需要在Hadoop上实时地通过SQL和熟悉的脚本来管理、操纵和查询大型复杂数据的人。

学习Apache Pig、Apache Hive和Cloudera Impala如何通过过滤联接和其他用户自定义的功能

来支持数据的转型和分析。

【课程内容】

1、Hadoop生态圈、实验场景介绍、用Hadoop工具导入数据

2、pig的特性、使用案例、和pig交互、pig Latin语法、Field定义、用pig执行ETL流程

3、pig处理复杂数据，复杂/nested嵌套的数据类型、用pig分析广告战役的数据

4、pig的多数据组操作，pig链接多数据组、用pig分析离散的数据组

5、用流处理和UDFs扩展pig，Macros和Imports、contributed functions，用其他语言和pig一起处理数据

6、pig故障排查和优化，用web界面排查一个故障的任务、Data采样和故障排查、理解执行计划、提高pig任务性能

7、hive表结构和数据储存、对比hive和传统数据库、hive vs.pig、hive使用案例

8、hive的关系数据分析、数据管理、文本处理、优化及扩展，在shell、脚本和hue上运行hive查询

9、impala和hive、pig、关系数据库的不同、使用impala shell

10、采样impala分析数据，过滤、排序and limiting results，提升impala性能，impala的交互式分析

11、对比map reduce、pig、hive、impala和关系数据库

【学员基础】

该课程适合有SQL经验和基本UNIX和Linux命令的数据分析师、业务分析师和管理员

事先无需Java和Apache Hadoop的经验

【授课形式】

案例教学+上机实践

时间: 2016-4-18 11:07

作者: souwin

更新5、6月上海课程安排
管理员：5月21-24日
Spark and Hadoop：6月27-30日

通信人家园 (https://www.txrjy.com/)