课程价格分析:
随着云计算、大数据迅速发展,亟需用hadoop解决大数据量高并发访问的瓶颈。谷歌、淘宝、百度、京东等底层都应用hadoop。越来越多的企 业急需引入hadoop技术人才。由于掌握Hadoop技术的开发人员并不多,直接导致了这几年hadoop技术的薪水远高于JavaEE及 Android程序员。
Hadoop入门薪资已经达到了 8K 以上,工作1年可达到 1.2W 以上,具有2-3年工作经验的hadoop人才年薪可以达到 30万—50万 。
一般需要大数据处理的公司基本上都是大公司,所以学习hadoop技术也是进大公司的捷径!
本课程讲师拥有多年Greenplum和Hadoop实战经验,课程注重实践,原理剖析,实践分享,让学员能快速全面地掌握Greenplum操作和调优,以及Hadoop的搭建与运用实战。
课程实战、实用、实际,总共 96 课时,系史上最全最深入的讲解Greenplum、Hadoop、云计算相关领域的技能课程,北风仅以此课程献给有志于从事大数据行业,追求高薪的有想法的程序员。
课程亮点多多:
亮点一、技术混搭
Greenplum+Hadoop,让你全面掌握玩转大数据的倚天剑和屠龙刀,让你学到不一样的精彩,成为不一样的复合型人才!
亮点二、高成低也就
亮点三、既注重技术基础,手把手传授技术,通过实操实战的讲授过程让学员沉淀技术,打好牢固坚实的基础;另外,也不 忘从行业、架构的高度,帮助大家扩宽视野,游刃有余。
亮点四、注重实践:原理剖析,实践分享;让学员能快速全面地掌握Greenplum操作和调优,以及Hadoop的搭建与运用实战。实战、实用、实际
亮点五、 全面覆盖了Greenplum完整知识体系,及关系型数据库管理和调优思想;
亮点六、课程涵盖Hadoop生态系统中所有常用组件;
亮点七、 学完此课程可以获得IT行业高薪职业发展能力。
你 了 解 大 数 据 吗 ?
“大数据”时代来临您准备好了么? 从十大技术和十大巨头了解大数据 Greenplum转身:Hadoop是数据库的未来


GREENPLUM适用场景:Greenplum的架构采用了MPP(大规模并行处理)。在 MPP 系统中,每个 SMP 节点也可以运行自己的操作系统、数据库等,它的特点主要就是查询速度快,数据装载速度快,批量DML处理快。而且性能可以随着硬件的添加,呈线性增加,拥有非常良好的可扩展性。因此,它主要适用于面向分析的应用。比如构建企业级ODS/EDW,或者数据集市等等。
GREENPLUM的前景:GREENPLUM 诞生于2003年硅谷,2010/07 EMC收购了GREENPLUM,并把GREENPLUM作为EMC面向分析云的战略核心产品,加以大力发展。该产品不仅在国际市场发展很快,在国内市场发展也很快。最著名的案例就是阿里巴巴集团,经过多种产品的精心选型,最终选择GREENPLUM作为它们的数据仓库平台存放数百TB的业务数据去高效支持各种分析应用。正是由于产品发展速度很快,但是在相关人才上存在很大缺口。
Greenplum Hadoop大数据分析平台:大量的半结构化和非结构化信息无法管理和存储,大数据增长速度惊人,每年以几何级数速度增长,需要有专业化的解决方案应对大数据挑战。EMC收购了Greenplum之后,推出的针对Hadoop的Greenplum的数据库软件。采用Greenplum HD技术管理半结构化和非结构化信息,整体TCO更低,除了进行有效存储和管理,可以通过MapReduce技术进行并行的分析和挖掘,把大量的数据存储变成有价值的数据资产。
课程内容简介:本课程分两大部分:第一部分全面深入地介绍了Greenplum数据库,包括架构特性、部署、管理、开发和调优等,由浅入深,理论结合实战,让同学全面彻底掌握这把大数据利剑。第二部分深入阐述了Hadoop的架构原理,Hadoop整体技术架构,包括HBase、Hive、Pig、ZooKeeper、Chukwa等实战运用。另外还介绍了云计算的基础知识和Hadoop在云计算领域的运用,以及剖析了Hadoop在各个互联网巨头商业环境的运用。本课程适合于有一定java基础知识,对数据库和sql语句有一定了解,熟练使用linux系统的技术人员,特别适合于想换工作或寻求高薪职业的人士。课程结束时,帮助学员实现如下目标:1、了解Greenplum和Hadoop的历史及目前发展的现状、以及它们的技术特点,从而把握分布式计算框架及未来发展方向,在大数据时代能为企业的技术选型及架构设计提供决策参考。2、深入理解Greenplum的技术核心和管理操作,以此为基础,进而掌握MPP架构数据库的使用和调优的思想。3、全面掌握Hadoop的架构原理和使用场景,并通过贯穿课程的项目进行实战锻炼,从而熟练使用Hadoop进行MapReduce程序开发。4、深入理解Hadoop整体技术架构,包括HBase、Hive、Pig、ZooKeeper、Chukwa等,对Hadoop运作机制有清晰全面的认识,可以独立规划及部署生产环境的Hadoop集群,掌握Hadoop基本运维思路和方法,对Hadoop集群进行管理和优化。5、理解什么是云计算和Hadoop在云计算领域的运用,以及理解Hadoop在各个互联网巨头商业环境的运用。第一部分 Greenplum 分布式数据库基础(41课时)1 Greenplum架构什么是GreenplumGreenplum体系结构Greenplum高可用性架构2 安装Greenplum配置环境安装并初始化GPDB系统启停数据库配置GP系统3 分布式数据库存储数据是如何存储的分布策略4 GBDB查询处理查询命令的执行SQL查询处理机制并行查询计划5 角色权限及客户端认证管理客户端认证管理用户和组6 客户端接口和程序pgAdmin IIIPSQL7 定义数据库对象创建并管理数据库创建并管理表空间创建并管理模式创建并管理表分区表数据分布与分区压缩存储与行列存储序列、索引与视图8 管理数据插入、更新、删除记录事务管理空间回收和统计9 查询数据定义查询使用函数和运算符查询分析10 工作负载及资源管理GP工作负载管理概述配置工作负载管理创建资源队列分配资源队列检查资源队列状态11 装载和卸载数据GP装载命令概述装载数据到GP从GP卸载数据格式化数据文件12 备份恢复串行备份和恢复并行恢复和恢复13 性能调优如何进行调优常见的性能问题14 GP系统配置参数关于GP的Master参数与本地化参数设置配置参数配置参数种类15 开启高可用性GP高可用概述开启GP的Mirror获知Segment何时失败恢复失败的Segment恢复失败的Master16 GP MapReduceMapReduce基础GP MapReduce编程MapReduce作业执行和故障诊断第二部分 Hadoop分布式平台(55课时)1 Hadoop的起源和体系Hadoop思想起源:GoogleHadoop子项目家族Hadoop的架构2 Hadoop的安装与配置准备和配置环境三种运行模式完全分布式模式安装3 HDFS-大数据存储HDFS概念与体系结构HDFS的可靠性HDFS文件操作HDFS API4 关于MapReduceMapReduce编程模型MapReduce的集群行为MapReduce任务的优化MapReduce工作机制错误处理及作业调度机制5 MapReduce应用开发Hadoop Eclipse插件开发数据筛选程序开发倒排索引程序开发6 Hadoop监控与管理页面监控hadoop备份7 HBase数据库Hbase体系结构HBase shellHBase API应用实例HBase场景应用HBase模式设计8 Hive数据仓库Hive组件与体系架构Hive安装配置Hive的服务接口HiveQL常用操作Hive的优化Hive UDF编程Hive综合实战9 Pig数据分析平台Pig框架Pig安装配置Pig的使用Pig的数据模型常用Pig Latin操作Pig UDF编程Pig数据分析实战10 ZooKeeper分布式服务框架ZooKeeper工作原理ZooKeeper设计目标ZooKeeper的数据结构和组成ZooKeeper的安装配置ZooKeeper命令行工具ZooKeeper APIZooKeeper实战:Hadoop任务调度11 Chukwa集群监控系统Chukwa的组成Chukwa架构和设计Chukwa安装与配置常用Chukwa命令实现自定义数据处理12 Hadoop商业应用案例云计算概念和特征云计算服务模式和形态Hadoop在云计算的运用京东商城百度阿里巴巴腾讯13 Greenplum Hadoop集群集成架构的特征集成架构的优势配置gphdfs协议使用环境使用HDFS外部表课程总目录:
以下职位在向你招手:
1. Greenplum数据仓库工程师
2. Hadoop运维工程师
3.大数据平台架构师
并可有机会向以下高薪职位发出挑战
一、Q:学这个课程需要什么基础?
A、讲师回答本课程适合于有一定java基础知识,对数据库和sql语句有一定了解,熟练使用linux系统的技术人员,特别适合于想换工作或寻求高薪职业的人士
二、Q:讲师水平如何?值得信赖吗?
A:讲师迪伦,10年以上IT行业从业经验,某知名500强企业大数据平台架构师,资深大数据处理专家。熟练掌握和应用多种技术架构和数据库,包括UNIX,Greenplum、Hadoop、Oracle、Cognos等,以及熟悉数据仓库、ETL、报表、数据分析等领域的技术运用。
三、Q:我该怎么学,如何才能学好这门课程,给些建议 ?
A: 讲师回答:
1.时间上的安排建议
本课程96讲,建议每天以2-3课程的进度进行学习,并在课后尽量独立完成课堂所讲的实例。
2.学习要求
不要只是做一名忠实的听众,请跟随我一起搭环境、做实验。遇到问题多想多问多尝试,享受解决问题的快感吧!
3.讲师建议
a. 如果没有学习基础,建议先补充一点Linux、Java基础,会更加得心应手;
b. 活学活用,举一反三。只有在熟练掌握各种技术在各种情况下的应用之后,才能掌握实现一个业务需求的最佳路径和最优方案;
c. 学海无涯苦作舟,坚持最重要,让现在的努力成就你不后悔的将来吧!
四、Q:课程涉及到哪些技术,版本是多少?
A:课程涉及到以下技术,目前基本都是最新版本:
1. Linux RedHat 版本是5.2
2. Ant 版本是1.8
3 Java 版本是 JDK1.6
4.Mysql 版本是5.6.16
5.Greenplum 版本是4.2
6.Hadoop 版本是1.2.1
7.Hbase 版本是0.94.16
8.Hive 版本是0.11
9.Pig 版本是0.12
10.ZooKeeper 版本是3.4.5
11.Chukwa 版本是0.4