教育资源为主的文档平台

当前位置: 查字典文档网> 所有文档分类> IT计算机> 服务器> Apache Hadoop社区聚焦Apache MapReduce

Apache Hadoop社区聚焦Apache MapReduce

上传者:宋轶群
|
上传时间:2015-04-21
|
次下载

Apache Hadoop社区聚焦Apache MapReduce



2012 年 11 月
Apache Hadoop* 社区聚焦
Apache* MapReduce
Devaraj Das 介绍了一种强大的大数据集并行处理模型 — Apache* MapReduce,它
同时也是您的 Apache Hadoop* 系统的核心。Devaraj 是 Apache Hadoop 项目的项
目管理委员会成员,Apache Hadoop 分布式文件系统(HDFS*)、MapReduce 和
Hcatalog 的委员,同时也是 Apache HBase* 数据库程序的贡献者。此外,他还是
Hortonworks 的共同创办人及技术成员之一。
Apache MapReduce:看似简单
Apache MapReduce 是一种编程模型,可提供并行处理大数据集
所需的高度可扩展性。MapReduce 最初在谷歌得到运用,目前
与实用程序层的 HDFS 和 Hadoop* Common 一起构成了开放源代
码 Apache Hadoop 框架的核心部件。其它 Apache Hadoop 系统组
件,例如 Apache Pig* 数据流语言和 Apache Hive* 数据仓库基础设
施,在数据处理之前均使用 MapReduce 进行前端数据集转换。
MapReduce 程序或作业运行在 Hadoop 集群的数百甚至数千台
服务器上,执行两个基本任务:
? 映射。HDFS 中的大数据集被转化为键值对,并均匀地分布
在集群上。
? 化简。映射任务的结果成为化简任务的输入,并结合到更小
的键值对中,来创建最终输出。
当在提供高汇聚 I/O 的集群上对 MapReduce 与 HDFS 进行配对
时,可借助高吞吐率高效地处理大数据集。
主从架构
MapReduce 采用主从架构。运行在单个节点或服务器上的
JobTracker 是主程序。运行在系统中其它节点之上的 TaskTrackers
是从程序。客户端向 MapReduce 框架提交作业。JobTracker 把它
分解为多项任务,并建立所需的数据结构,以跨整个集群并行
运行作业。工作分配给最近的、可用的 TaskTracker,后者将数
据输入映射并“洗牌”到特定的化简任务,且在此创建输出。
这种“数据局部性”是 MapReduce 框架的关键设计标准。它通
过存储并处理相同位置的数据支持较大数据集的高效吞吐。
“这种‘数据局部性’是 MapReduce 框架的关键设计标
准。它通过存储并处理相同位置的数据支持较大数据集
的高效吞吐。”
— Devaraj Das
确保大作业继续:容错
Apache* MapReduce 具有容错功能。在大型集群中,节点可
能会定期发生故障。当一个节点上的任务处理发生故障时,
MapReduce 会自动在另一节点上重新执行该任务。即使在发
生重要集群负载损耗时,作业也可继续运行。

版权声明:此文档由查字典文档网用户提供,如用于商业用途请与作者联系,查字典文档网保持最终解释权!

下载文档

热门试卷

2016年四川省内江市中考化学试卷
广西钦州市高新区2017届高三11月月考政治试卷
浙江省湖州市2016-2017学年高一上学期期中考试政治试卷
浙江省湖州市2016-2017学年高二上学期期中考试政治试卷
辽宁省铁岭市协作体2017届高三上学期第三次联考政治试卷
广西钦州市钦州港区2016-2017学年高二11月月考政治试卷
广西钦州市钦州港区2017届高三11月月考政治试卷
广西钦州市钦州港区2016-2017学年高一11月月考政治试卷
广西钦州市高新区2016-2017学年高二11月月考政治试卷
广西钦州市高新区2016-2017学年高一11月月考政治试卷
山东省滨州市三校2017届第一学期阶段测试初三英语试题
四川省成都七中2017届高三一诊模拟考试文科综合试卷
2017届普通高等学校招生全国统一考试模拟试题(附答案)
重庆市永川中学高2017级上期12月月考语文试题
江西宜春三中2017届高三第一学期第二次月考文科综合试题
内蒙古赤峰二中2017届高三上学期第三次月考英语试题
2017年六年级(上)数学期末考试卷
2017人教版小学英语三年级上期末笔试题
江苏省常州西藏民族中学2016-2017学年九年级思想品德第一学期第二次阶段测试试卷
重庆市九龙坡区七校2016-2017学年上期八年级素质测查(二)语文学科试题卷
江苏省无锡市钱桥中学2016年12月八年级语文阶段性测试卷
江苏省无锡市钱桥中学2016-2017学年七年级英语12月阶段检测试卷
山东省邹城市第八中学2016-2017学年八年级12月物理第4章试题(无答案)
【人教版】河北省2015-2016学年度九年级上期末语文试题卷(附答案)
四川省简阳市阳安中学2016年12月高二月考英语试卷
四川省成都龙泉中学高三上学期2016年12月月考试题文科综合能力测试
安徽省滁州中学2016—2017学年度第一学期12月月考​高三英语试卷
山东省武城县第二中学2016.12高一年级上学期第二次月考历史试题(必修一第四、五单元)
福建省四地六校联考2016-2017学年上学期第三次月考高三化学试卷
甘肃省武威第二十三中学2016—2017学年度八年级第一学期12月月考生物试卷

网友关注

天天练面试:面试每日一练结构化面试模拟题答案03.31
行测题库:行测每日一练言语理解练习题04.19
行测题库:行测每日一练言语理解练习题答案04.19
天天练面试:面试每日一练结构化面试模题答案03.24
天天练面试:面试每日一练结构化面试模拟题答案03.10
行测题库:行测每日一练资料分析练习题04.21
天天练面试:面试每日一练结构化面试模拟题03.17
天天练面试:面试每日一练结构化面试模拟题答案03.29
天天练面试:面试每日一练结构化面试模拟题答案03.17
天天练面试:面试每日一练结构化面试模拟题03.15
行测题库:行测每日一练资料分析练习题答案04.21
天天练面试:面试每日一练结构化面试模拟题答案04.01
天天练面试:面试每日一练结构化面试模拟题答案03.21
天天练面试:面试每日一练结构化面试模拟题答案04.11
天天练面试:面试每日一练结构化面试模拟题03.21
天天练面试:面试每日一练结构化面试模拟题03.28
天天练面试:面试每日一练结构化面试模拟题03.10
天天练面试:面试每日一练结构化面试模拟题答案03.14
天天练面试:面试每日一练结构化面试模拟题04.08
天天练面试:面试每日一练结构化面试模拟题03.23
天天练面试:面试每日一练结构化面试模拟题03.18
天天练面试:面试每日一练结构化面试模拟题答案03.18
天天练面试:面试每日一练结构化面试模拟题04.07
天天练面试:面试每日一练结构化面试模拟题03.31
天天练面试:面试每日一练结构化面试模拟题答案03.25
天天练面试:面试每日一练结构化面试模拟题03.30
天天练面试:面试每日一练结构化面试模拟题答案03.28
天天练面试:面试每日一练结构化面试模题答案03.22
天天练面试:面试每日一练结构化面试模拟题答案04.07
天天练面试:面试每日一练结构化面试模拟题04.01

网友关注视频

冀教版英语五年级下册第二课课程解读
【部编】人教版语文七年级下册《逢入京使》优质课教学视频+PPT课件+教案,安徽省
外研版英语七年级下册module1unit3名词性物主代词讲解
七年级英语下册 上海牛津版 Unit3
人教版历史八年级下册第一课《中华人民共和国成立》
【部编】人教版语文七年级下册《泊秦淮》优质课教学视频+PPT课件+教案,辽宁省
第五单元 民族艺术的瑰宝_15. 多姿多彩的民族服饰_第二课时(市一等奖)(岭南版六年级上册)_T129830
每天日常投篮练习第一天森哥打卡上脚 Nike PG 2 如何调整运球跳投手感?
北师大版数学 四年级下册 第三单元 第二节 小数点搬家
冀教版小学英语四年级下册Lesson2授课视频
二年级下册数学第一课
苏科版数学七年级下册7.2《探索平行线的性质》
8 随形想象_第一课时(二等奖)(沪教版二年级上册)_T3786594
化学九年级下册全册同步 人教版 第18集 常见的酸和碱(二)
河南省名校课堂七年级下册英语第一课(2020年2月10日)
外研版英语七年级下册module3 unit2第二课时
冀教版小学数学二年级下册第二单元《有余数除法的简单应用》
冀教版小学数学二年级下册第二单元《有余数除法的竖式计算》
冀教版小学数学二年级下册第二单元《余数和除数的关系》
人教版二年级下册数学
七年级下册外研版英语M8U2reading
第8课 对称剪纸_第一课时(二等奖)(沪书画版二年级上册)_T3784187
外研版英语三起6年级下册(14版)Module3 Unit1
七年级英语下册 上海牛津版 Unit5
冀教版小学数学二年级下册第二周第2课时《我们的测量》宝丰街小学庞志荣.mp4
冀教版英语三年级下册第二课
北师大版数学四年级下册第三单元第四节街心广场
外研版英语三起6年级下册(14版)Module3 Unit2
沪教版牛津小学英语(深圳用) 四年级下册 Unit 8
苏科版数学八年级下册9.2《中心对称和中心对称图形》