Hadoop MapRedue是如何实现计算向数据靠拢？

如题所述

推荐答案 2021-07-16

大规模数据处理时，MapReduce在三个层面上的基本构思：如何对付大数据处理：分而治之。对相互间不具有计算依赖关系的大数据，实现并行最自然的办法就是采取分而治之的策略。上升到抽象模型：Mapper与Reducer。MPI等并行计算方法缺少高层并行编程模型，为了克服这一缺陷，MapReduce借鉴了Lisp函数式语言中的思想，用Map和Reduce两个函数提供了高层的并行编程抽象模型。上升到构架：统一构架，为程序员隐藏系统层细节。MPI等并行计算方法缺少统一的计算框架支持，程序员需要考虑数据存储、划分、分发、结果收集、错误恢复等诸多细节；为此，MapReduce设计并提供了统一的计算框架，为程序员隐藏了绝大多数系统层面的处理细节。MapReduce借鉴了函数式程序设计语言Lisp中的思想，定义了如下的Map和Reduce两个抽象的编程接口，由用户去编程实现：map：(k1;v1)[(k2;v2)]输入：键值对(k1;v1)表示的数据。处理：文档数据记录[(k2;v2)](如文本文件中的行，或数据表格中的行)将以“键值对”形式传入map函数；map函数将处理这些键值对，并以另一种键。值对形式输出处理的一组键值对中间结果。输出：键值对[(k2;v2)]表示的一组中间数据。reduce:(k2;[v2])[(k3;v3)]输入：由map输出的一组键值对[(k2;v2)]将被进行合并处理将同样主键下的不同数值合并到一个列表[v2]中，故reduce的输入为(k2;[v2])处理：对传入的中间结果列表数据进行某种整理或进一步的处理,并产生最终的某种形式的结果输出[(k3;v3)]。输出：最终输出结果[(k3;v3)]。Map和Reduce为程序员提供了一个清晰的操作接口抽象描述。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://33.wendadaohang.com/zd/RdP44chRhPhWBB04W45.html

相似回答

请简要描述Hadoop计算框架MapReduce的工作原理答：分为2个步骤，map和reduce，map专门负责对每个数据独立地同时地打标签，框架会对相同标签的数据分成一组，reduce对分好的那些组数据做累计计算。我们只要分别实现map和reduce就可以了

mapreduce的实现方式mapreduce的过程答：1、1.首先介绍一下wordcount 早mapreduce框架中的对应关系大家都知道 mapreduce 分为 map 和reduce 两个部分，那么在wordcount例子中，很显然对文件word 计数部分为map，对 word 数量累计部分为 reduce；大家都明白 map接受一个参数，经过map处理后，将处理结果作为reduce的入参分发给reduce，然后在...

Hadoop和MapReduce究竟分别是做什么用的答：MapReduce是用来做大规模并行数据处理的数据模型。方便了编程人员在不会分布式并行编程的情况下，将自己的程序运行在分布式系统上。

大家正在搜

ue怎么区分port数据 ue怎么区分不同port的数据 ue怎么筛选数据 ue重复数据筛选 ue五万条数据怎么快速更改 ue搜索二进制数据 ue怎么去除重复数据 ue按条件拆分数据 ue怎么替换掉数据里的一个单词