Hadoop大数据零基础实战培训教程简介:
Hadoop是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有着高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高传输率(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求(requirements)这样可以流的形式访问(streaming access)文件系统中的数据。
Hadoop 是一个能够对大量数据进行分布式处理的软件框架。但是 Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop 是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。Hadoop 是高效的,因为它以并行的方式工作,通过并行处理加快处理速度。Hadoop 还是可伸缩的,能够处理 PB 级数据。此外,Hadoop 依赖于社区服务器,因此它的成本比较低,任何人都可以使用。
本资料共包含以下附件:
Avro数据序列化系统(1).rar
Avro数据序列化系统(2).rar
Chukwa集群监控系统(1).rar
Chukwa集群监控系统(2).rar
日志收集系统(1).rar
Flume日志收集系统(2).rar
Greenplum架构(1).rar
Greenplum架构(2).rar
Greenplum架构(3).rar
Greenplum架构(4).rar
Hadoop2.0YARN深入浅出(1).rar
Hadoop2.0YARN深入浅出(2).rar
Hadoop2.0YARN深入浅出(3).rar
Hadoop2.0YARN深入浅出(4).rar
Hadoop2.0YARN深入浅出(5).rar
Hadoop2.0YARN深入浅出(6).rar
Hadoop的起源.rar
Hadoop的体系.rar
Hadoop商业应用案例(1).rar
Hadoop商业应用案例(2).rar
HBase案例分析.rar
HBase编程实践.rar
MapReduce多语言编程(1).rar
MapReduce多语言编程(2).rar
MapReduce高阶实现(1).rar
MapReduce高阶实现(2).rar
Sqoop数据交换工具(1).rar
Sqoop数据交换工具(2).rar
安装Greenplum(1).rar
安装Greenplum(2).rar