文章目录
-
- 一、hadoop简介
-
- 1.1 特性
- 二、HDFS架构
- 二、YARN 架构
- 三、MapReduce架构
- 四、HDFS、YARN、MapReduce三者关系
一、hadoop简介
Hadoop 是由Apache开发的分布式系统的基础架构,主要解决海量数据的存储和分析计算问题;1.1 特性
高可靠性:
底层维护多个数据副本,若某个存储出现故障,也不会丢失数据;高扩展性:
可动态扩张,在集群中分配任务数据;高效性:
在MapReduce下,能够并行工作,提高处理速度;高容错性:
能够自动将失败的任务重新分配;二、HDFS架构
若其中一台服务器宕机,则能够自动将任务分配给其他服务器运作;
该架构是一个分布式文件系统;
文章图片
二、YARN 架构
NameNode
:存储文件的元数据;【文件名、文件属性、文件的块列表、以及所在的DataNode
】;DataNode
:本地文件系统存储文件系统
以及块数据的校验和
;SNameNode
:每隔一段时间就将NameNode
的数据进行备份
;
Yet Another Resource Negotiator简称YARN ,另一种资源协调者
,是Hadoop的资源管理器;
在hadoop1.x版本中,没有该架构,直至2.x才出现;是由1.x中的MapReduce分离出来的;
ResourceManager(RM)
:管理整个集群资源;NodeManager(NM)
:管理节点服务器资源;ApplicationMaster(AM)
:管理单任务运行;Container
:相当于独立的服务器,能够运行任务;
文章图片
三、MapReduce架构
该过程分为两阶段:
- Map阶段并行处理输入数据;
- Reduce阶段对Map结果进行汇总;
文章图片
四、HDFS、YARN、MapReduce三者关系 【hadoop|Hadoop | 【02】架构简介】
文章图片
推荐阅读
- Linux驱动|音频ALSA架构简介
- Hadoop3数据容错技术(纠删码)
- DCI架构是如何解决DDD战术建模缺点的()
- hadoop的日常操作
- Hadoop|HDFS 巡检
- 又到抢票季(12306 的架构到底是不是国内最牛逼的架构())
- 0009 - 基于MapReduce的应用案例
- 0008 - MapReduce中Shuffle和排序机制解析
- 马士兵mca架构师全套