会员中心 | 会员注册 | 兼职信息发布浏览手机版！人工翻译英语IT服务贫困儿童资助 | 留言板 | 设为首页 | 加入收藏繁體中文

当前位置：首页 > 行业文章 > 笔译技术 > 正文

MapReduce：分布式计算的框架

发布时间： 2023-04-04 09:26:15 作者：etogether.net 来源：网络浏览次数：

从上述例子可以看出，reducer的数量并不是固定的。此外，在MapReduce的框架中还有其他一些灵活的配置选项。MapReduce的整个编配工作由主节点（master node)控制。这些主节点控制整个MapReduce作业编配，包括每份数据存放的节点位置，以及map、sort和reduce等阶段的时序控制等。此外，主节点还要包含容错机制。一般地，每份mapper的输人数据会同时分发到多个节点形成多份副本，用于事务的失效处理。一个MapReduce集群的示意图如图1所示。

图1.png

图1 MapReduce框架的示意图。在该集群中有3台双核机器，如果机器0失效，作业仍可以正常继续

图1 的每台机器都有两个处理器，可以同时处理两个map或者reduce任务。如果机器0在map阶段宕机，主节点将会发现这一点。主节点在发现该问题之后，会将机器0移出集群，并在剩余的节点上继续执行作业。在一些MapReduce的实现中，在多个机器上都保存有数据的多个备份，

例如在机器0上存放的输人数据可能还存放在机器1上，以防机器0出现问题。同时，每个节点都必须与主节点通信，表明自己工作正常。如果某节点失效或者工作异常，主节点将重启该节点或者将该节点移出可用机器池。

总结一下上面几个例子中关于MapReduce的学习要点：

▷ 主节点控制MapReduce的作业流程；

▷ MapReduce的作业可以分成map任务和reduce任务；

▷ map任务之间不做数据交流，reduce任务也一样；

▷ 在map和reduce阶段中间，有一个sort或combine阶段；

▷ 数据被重复存放在不同的机器上，以防某个机器失效；

▷ mapper和reducer传输的数据形式为key/value对。

Apache的Hadoop项目是MapReduce框架的一个实现。

责任编辑：admin

微信公众号

[上一页][1] [2] 【欢迎大家踊跃评论】

上一篇：Terminology Management And Unmanaged Source Terminology
下一篇：One Game In Localization Of Many Languages

《译聚网》倡导尊重与保护知识产权。如发现本站文章存在版权问题，烦请30天内提供版权疑问、身份证明、版权证明、联系方式等发邮件至18964029557@163.com，我们将及时沟通与处理。

我来说两句

评论列表

已有 0 条评论（查看更多评论）

相关文章

翻译的原则和标准

翻译转译法举例

日语助词さえ（でさえ）的翻译处理

日语助词くらい（ぐらい）的翻译

英语的形合与意合

2018年中国翻译公司排名前十榜单

2018年全球翻译公司100强排名（语言服务供应商）

2016年世界排名前100名语言服务供应商

2016年美国排名前二十名翻译公司

2016年亚太地区翻译公司排名前十五位

翻译理论

外语课程

书籍分类

英语IT服务