hadoop搭建与学习

Hadoop®是Apache™开源的可靠的,可伸缩扩展的分布式计算系统 hadoop是一个大数据处理的框架,它允许使用简单的编程模型在计算机集群之间对大型数据集进行分布式处理。它被设计成从单个服务器扩展到数千台机器, 每台机器都提供本地计算和存储。相对于依赖硬件来提供高可用性,hadoop本身的设计是为了检测和处理应用层的故障,在一组计算机上提供高可用性的服务。

Hadoop包含的主要模块: Hadoop Common: 支持其他Hadoop模块的常用实用程序。
Hadoop Distributed File System (HDFS™): 提供对应用程序数据的高吞吐量访问的分布式文件系统。
Hadoop YARN: 作业调度和集群资源管理框架。 Hadoop MapReduce: 基于YARN的大数据集并行处理系统。 Hadoop Ozone: 用于Hadoop的对象存储系统。

接下来我会从hadoop的搭建至运行等学习内容做尽量详细的笔记

Table of Contents