YARN/MRv2 中基本术语介绍-k6k4.com

作者:Dong | 新浪微博：西成懂 | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明
网址:http://dongxicheng.org/mapreduce-nextgen/basic-concepts/
本博客的文章集合:http://dongxicheng.org/recommend/

本博客微信公共账号：hadoop123（微信号为：hadoop-123），分享hadoop技术内幕，hadoop最新技术进展，发布hadoop相关职位和求职信息，hadoop技术交流聚会、讲座以及会议等。二维码如下：

YARN/MRv2是下一代MapReduce框架（见Hadoop-0.23.0），该框架完全不同于当前的MapReduce框架，它在扩展性，容错性和通用性等方面更出色，据统计，Yarn有超过150000行代码，完全是重写编写的。本文介绍了YARN/MRv2中基本术语的含义，帮助有兴趣的程序员们对YARN有一个初步的理解。

（1） YARN

下一代MapReduce框架的名称，为了容易记忆，一般称为MRv2（MapReduce version 2）。该框架已经不再是一个传统的MapReduce框架，甚至与MapReduce无关，她是一个通用的运行时框架，用户可以编写自己的计算框架，在该运行环境中运行。用于自己编写的框架作为客户端的一个lib，在运用提交作业时打包即可。该框架为提供了以下几个组件：

资源管理：包括应用程序管理和机器资源管理
资源双层调度
容错性：各个组件均有考虑容错性
扩展性：可扩展到上万个节点

当前比较有名的计算框架有：

MapReduce：google提出的计算框架，在互联网大规模数据处理方面使用广泛，但它存在缺点，如：不支持DAG作业，迭代式作业等。

Apache Giraph：图算法处理框架，采用BSP模型（bulk-synchronous parallel model），可用于计算pagerank，shared connections, personalization-based popularity等迭代类算法。

Apache HAMA：基于BSP模型的分布式计算框架，可用于大规模科学计算，如矩阵，图算法，网络算法等，受Google’s Pregel启发，但又有所不同，HAMA是个更加通用的框架，不仅仅支持图算法。

Open MPI：这是一个高性能计算函数库，通常在HPC（High Performance Computing）中采用，与MapReduce相比，其性能更高，用户可控性更强，但编程复杂，容错性差，可以说，各有所长，在实际应用中，针对不同该应用会采用MPI或者MapReduce。

HBase ：Hadoop Database，是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，仿照Google Bigtable实现的，近几年逐步的流行，慢慢取代Cassandra了（在Hadoop In China2011上，FaceBook工程师说他们早就放弃Cassandra而改用HBase）。

以上这几个框架各有所长，在一些互联网公司中均会采用，如果分别部署安装这些计算框架过于繁琐，有了YARN后，这些计算框架可统一在YARN环境中部署。目前仅有MapReduce可使用，其他几个在陆续开发中，具体可参考：

Apache Hadoop MapReduce, of course! – https://issues.apache.org/jira/browse/MAPREDUCE-279

Spark - https://github.com/mesos/spark-yarn/

Apache HAMA – https://issues.apache.org/jira/browse/HAMA-431

Apache Giraph – https://issues.apache.org/jira/browse/GIRAPH-13

Open MPI – https://issues.apache.org/jira/browse/MAPREDUCE-2911

Generic Co-Processors for Apache HBase – https://issues.apache.org/jira/browse/HBASE-4047

Apache HBase deployment using YARN – https://issues.apache.org/jira/browse/HBASE-4329

（2） ResourceManager

简称“RM”。

MRv2最基本的设计思想是将JobTracker的两个主要功能，即资源管理和作业调度/监控分成两个独立的进程。在该解决方案中包含两个组件：全局的ResourceManager（RM）和与每个应用相关的ApplicationMaster（AM）。这里的“应用”指一个单独的 MapReduce作业或者DAG作业。RM和与NodeManager（NM，每个节点一个）共同组成整个数据计算框架。RM是系统中将资源分配给各个应用的最终决策者。AM实际上是一个具体的框架库，它的任务是【与RM协商获取应用所需资源】和【与NM合作，以完成执行和监控task的任务】。

RM有两个组件组成：

调度器（Scheduler）

应用管理器（ApplicationsManager，ASM）

调度器根据容量，队列等限制条件（如每个队列分配一定的资源，最多执行一定数量的作业等），将系统中的资源分配给各个正在运行的应用。这里的调度器是一个“纯调度器”，因为它不再负责监控或者跟踪应用的执行状态等，此外，他也不负责重新启动因应用执行失败或者硬件故障而产生的失败任务。调度器仅根据各个应用的资源需求进行调度，这是通过抽象概念“资源容器”完成的，资源容器（Resource Container）将内存，CPU，磁盘，网络等资源封装在一起，从而限定每个任务使用的资源量。

调度器内嵌有策略可插拔的插件，主要负责将集群中得资源分配给多个队列和应用。当前MapReduce的调度器，如Capacity Scheduler和Fair Scheduler，均可作为该插件。