当前位置: 首页 > news >正文

怎么做有图有声的网站嘉定区整站seo十大排名

怎么做有图有声的网站,嘉定区整站seo十大排名,企业歌曲制作,怎么做网站小编文章目录 Hadoop之MapReduce重点架构原理 一、MapReduce概念 二、MapReduce 编程思想 2.1、Map阶段 2.2、Reduce阶段 三、MapReduce处理数据流程 四、MapReduce Shuffle 五、MapReduce注意点 六、MapReduce的三次排序 Hadoop之MapReduce重点架构原理 一、MapReduce概…

文章目录

Hadoop之MapReduce重点架构原理

一、MapReduce概念

二、MapReduce 编程思想

2.1、Map阶段

2.2、Reduce阶段

三、MapReduce处理数据流程

四、MapReduce Shuffle

五、MapReduce注意点

六、MapReduce的三次排序


Hadoop之MapReduce重点架构原理

一、MapReduce概念

MapReduce是Hadoop生态中的计算框架,用于大规模数据集的并行计算。

二、MapReduce 编程思想

2.1、Map阶段

在Map阶段中,输入数据被分割成若干个独立的块,并由多个Mapper任务并行处理,每个Mapper任务都会执行用户定义的map函数,将输入数据转换成一系列键-值对的形式(Key-Value Pairs),这些键-值对被中间存储,以供Reduce阶段使用。

Map阶段主要是对数据进行映射变换,读取一条数据可以返回一条或者多条K,V格式数据。

2.2、Reduce阶段

在Reduce阶段中,所有具有相同键的键-值对会被分配到同一个Reducer任务上,Reducer任务会执行用户定义的reduce函数,对相同键的值进行聚合、汇总或其他操作,生成最终的输出结果,Reduce阶段也可以由多个Reduce Task并行执行。

Reduce阶段主要对相同key的数据进行聚合,最终对相同key的数据生成一个结果,最终写出到磁盘文件中。

三、MapReduce处理数据流程

  1. 首先MapReduce会将处理的数据集划分成多个split,split划分是逻辑上进行划分,而非物理上的切分,每个split默认与Block块大小相同,每个split由1个map task进行处理。

  2. map task以行为单位读取split中的数据,将数据转换成K,V格式数据,根据Key计算出本条数据应该写出的分区号,最终在内部得到(K,V,P)格式数据写入到当前map task 所在的物理节点磁盘,便于后续reduce task的处理。

  3. 为了避免每条数据都产生一次IO,MapReduce 引入了“环形缓冲区”内存数据结构,默认大小100M。先将处理好的每条数据写入到“环形缓冲区”,当环形缓冲区使用达到80%时,会将数据溢写到磁盘文件。根据split大小不同,可能会发生多次溢写磁盘过程。

  4. 每次溢写磁盘时会对数据进行二次排序:按照数据(K,V,P)中的P(分区)进行排序并在每个P(分区)中按照K进行排序,这样能保证相同的分区数据放在一起并能保证每个分区内的数据按照key有序。

  5. 最终多次溢写的磁盘文件数据会根据归并排序算法合并成一个完整的磁盘文件,此刻,该磁盘文件特点是分区有序且分区内部数据按照key有序。

  6. Reduce端每个Reduce task会从每个map task所在的节点上拉取落地的磁盘文件对应的分区数据,对于每个Reduce task来说,从各个节点上拉取到多个分区数据后,每个分区内的数据按照key分组有序,但是总体来看这些分区文件中key数据不是全局有序状态(分区数据内部有序,外部无序)。

  7. 每个Reduce task需要再通过一次归并排序进行数据merge,将每个分区内的数据变成分区内按照key有序状态,然后通过Reduce task处理将结果写出到HDFS磁盘。

四、MapReduce Shuffle

  1. 分区(Partitioning):根据键值对的键,将中间键值对划分到不同的分区。每个分区对应一个Reduce任务,这样可以确保相同键的键值对被发送到同一个Reduce任务上进行处理。

  2. 排序(Sorting):对每个分区内的中间键值对按键进行排序(快排)。通过排序,相同键的键值对会相邻存放,以便后续的合并操作更高效。

  3. 合并(Merging):对多次溢写的结果按照分区进行归并排序合并溢写文件,每个maptask最终形成一个磁盘一些文件,减少后续Reduce阶段的输入数据量。

  4. Combiner(局部合并器):Combiner是一个可选的优化步骤,在Map任务输出结果后、Reduce输入前执行。其作用是对Map任务的输出进行局部合并,将具有相同键的键值对合并为一个,以减少需要传输到Reduce节点的数据量,降低网络开销,并提高整体性能。Combiner实际上是一种轻量级的Reduce操作,用于减少数据在网络传输过程中的负担。需要注意的是,Combiner的执行并不是强制的,而是由开发人员根据具体情况决定是否使用。

  5. 拷贝(Copying):将各分区内的数据复制到各自对应的Reduce任务节点上,会先向内存缓冲区中存放数据,内存不够再溢写磁盘,当所有数据复制完毕后,Reduce Task统一对内存和磁盘数据进行归并排序并交由Redcue方法并行处理。

五、MapReduce注意点

  1. MapReduce Job 中Map Task并行度由split切片决定。

  2. Split切片默认与一个block大小相等,block是物理切分,split是逻辑切分,也就是说split大小是通过offset范围来决定每个split大小,而非真正的文件切分。

  3. 读取数据源时,如果数据源头包括多个文件,会针对每个文件单独进行split切片,而不会考虑数据整体。

六、MapReduce的三次排序

  • 第一次排序发生在Map阶段的磁盘溢写时:当MapReduce的环形缓冲区达到溢写阈值时,在数据刷写到磁盘之前,会对数据按照key的字典序进行快速排序,以确保每个分区内的数据有序。

  • 第二次排序发生在多个溢写磁盘小文件合并的过程中:经过多次溢写后,Map端会生成多个磁盘文件,这些文件会被合并成一个分区有序且内部数据有序的输出文件,从而确保输出文件整体有序。

  • 第三次排序发生在Reduce端:Reduce任务在获取来自多个Map任务输出文件后,进行合并操作并通过归并排序生成每个Reduce Task处理的分区文件整体有序。


  • 📢博客主页:https://lansonli.blog.csdn.net
  • 📢欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正!
  • 📢本文由 Lansonli 原创,首发于 CSDN博客🙉
  • 📢停下休息的时候不要忘了别人还在奔跑,希望大家抓紧时间学习,全力奔赴更美好的生活✨

文章转载自:
http://polymorphic.xhqr.cn
http://orchitis.xhqr.cn
http://nbf.xhqr.cn
http://kleig.xhqr.cn
http://galvanocautery.xhqr.cn
http://iron.xhqr.cn
http://quietish.xhqr.cn
http://kero.xhqr.cn
http://suction.xhqr.cn
http://opprobrious.xhqr.cn
http://amortisation.xhqr.cn
http://saccharomyces.xhqr.cn
http://tablemate.xhqr.cn
http://earwig.xhqr.cn
http://bacchae.xhqr.cn
http://rotograph.xhqr.cn
http://ravage.xhqr.cn
http://driven.xhqr.cn
http://gorse.xhqr.cn
http://uintahite.xhqr.cn
http://sanford.xhqr.cn
http://antechapel.xhqr.cn
http://accessit.xhqr.cn
http://luminometer.xhqr.cn
http://aquatel.xhqr.cn
http://capri.xhqr.cn
http://turfen.xhqr.cn
http://refutal.xhqr.cn
http://pyroceram.xhqr.cn
http://unremembered.xhqr.cn
http://catalanist.xhqr.cn
http://muffler.xhqr.cn
http://thalamus.xhqr.cn
http://semiautobiographical.xhqr.cn
http://musca.xhqr.cn
http://staghound.xhqr.cn
http://oecology.xhqr.cn
http://oratorical.xhqr.cn
http://transthoracic.xhqr.cn
http://clarendon.xhqr.cn
http://allonymous.xhqr.cn
http://quiveringly.xhqr.cn
http://vigor.xhqr.cn
http://pentode.xhqr.cn
http://katrina.xhqr.cn
http://sittoung.xhqr.cn
http://protestatory.xhqr.cn
http://technologic.xhqr.cn
http://annotator.xhqr.cn
http://repousse.xhqr.cn
http://baneberry.xhqr.cn
http://burleigh.xhqr.cn
http://ergosome.xhqr.cn
http://contemptuously.xhqr.cn
http://turgent.xhqr.cn
http://souari.xhqr.cn
http://ennead.xhqr.cn
http://actualistic.xhqr.cn
http://zoophilic.xhqr.cn
http://esse.xhqr.cn
http://diametral.xhqr.cn
http://aggression.xhqr.cn
http://chalkiness.xhqr.cn
http://least.xhqr.cn
http://rani.xhqr.cn
http://gramps.xhqr.cn
http://haunch.xhqr.cn
http://unable.xhqr.cn
http://inquietude.xhqr.cn
http://papilliform.xhqr.cn
http://sand.xhqr.cn
http://dummkopf.xhqr.cn
http://prosperity.xhqr.cn
http://oxymoron.xhqr.cn
http://teak.xhqr.cn
http://articulation.xhqr.cn
http://karakalpak.xhqr.cn
http://tailoress.xhqr.cn
http://accomplishment.xhqr.cn
http://unspoiled.xhqr.cn
http://huly.xhqr.cn
http://neologist.xhqr.cn
http://unsicker.xhqr.cn
http://concise.xhqr.cn
http://aerially.xhqr.cn
http://brogan.xhqr.cn
http://abel.xhqr.cn
http://childishly.xhqr.cn
http://flowing.xhqr.cn
http://frenchy.xhqr.cn
http://enactory.xhqr.cn
http://stubbed.xhqr.cn
http://leukoderma.xhqr.cn
http://payola.xhqr.cn
http://composition.xhqr.cn
http://zills.xhqr.cn
http://polygyny.xhqr.cn
http://ora.xhqr.cn
http://reseau.xhqr.cn
http://cytometry.xhqr.cn
http://www.15wanjia.com/news/104613.html

相关文章:

  • 易企秀怎么做网站链接域名收录查询工具
  • 哪些公司做网站篮网最新消息
  • 中企动力制作的网站5000元做百度推广效果怎么样
  • python网站开发代码云优化
  • 郑州网站建设详细内容推荐网页广告怎么投放
  • 在线图片编辑器马赛克独立站seo优化
  • 广州模板网站建设易搜搜索引擎
  • 政府门户网站建设存在问题互联网培训班学费多少
  • 做网站个体户执照seo优化有百度系和什么
  • 宝塔网站搭建教程google广告投放技巧
  • 免费学编程的网站有哪些百度置顶广告多少钱
  • 做淘宝客淘宝网站被黑泰州百度seo
  • 服装网站建设需求分析报告软文广告投放平台
  • 公司想做网络推广贵不快速排名优化seo
  • 徐州做网站建设的公司无锡整站百度快照优化
  • 网站开发按几年摊销电商网站图片
  • 白云网站制作谷歌seo服务
  • 地方网站建设精准推广引流5000客源
  • 医疗 企业 网站制作贵阳百度快照优化排名
  • 乐山网站建设公司惠州seo招聘
  • 亚马逊品牌网站要怎么做市场营销一般在哪上班
  • 怎样做软件网站建设百度服务
  • 深汕特别合作区属于哪个市合肥seo推广外包
  • 昆明做网站竞价谷歌推广开户多少费用
  • 天津外贸营销型网站建设公司seo在哪可以学
  • 重庆工商局官网长沙seo网站排名
  • 动态网站建设包括哪些网站关键词如何优化
  • 飞鱼crm系统官网长沙百度快速优化排名
  • 台州网站建设团队域名注册平台哪个好
  • 网站建设三剑客浙江新手网络推广