当前位置: 首页 > news >正文

青岛h5建站模板专业网站快速

青岛h5建站模板,专业网站快速,页面制作多少钱,经营性网站备案网目录 MapReduce流程简述a) Map倾斜b) Join倾斜c) Reduce倾斜 首先回顾一下MapReduce的流程 MapReduce流程简述 输入分片: MapReduce 作业开始时,输入数据被分割成多个分片,每个分片大小一般在 16MB 到 128MB 之间。这些分片会被分配给不同的…

目录

    • MapReduce流程简述
    • a) Map倾斜
    • b) Join倾斜
    • c) Reduce倾斜

首先回顾一下MapReduce的流程

MapReduce流程简述

输入分片: MapReduce 作业开始时,输入数据被分割成多个分片,每个分片大小一般在 16MB 到 128MB 之间。这些分片会被分配给不同的 Map 任务进行处理。
Map 阶段: Map 阶段的任务是处理输入分片,并为每个分片生成一个或多个键值对(key/value pair)。Map 函数由用户编写,以处理具体的业务逻辑。
Shuffle 阶段:在 Map 阶段完成后,系统会自动进行 Shuffle 阶段。在这个阶段,系统会根据 Map 阶段生成的键值对中的键(key),将值(value)进行重新排序和分组,同一个键对应的值会被组合在一起。
Reduce 阶段:Shuffle 阶段后是 Reduce 阶段。在此阶段,Reduce 函数(也由用户编写)会处理 Shuffle 阶段生成的每个键和对应的值的集合,并生成一组输出结果。
输出:最后,MapReduce 作业的输出会被写入到文件系统中,一般是分布式文件系统,如 Hadoop 的 HDFS。这样,输出结果就可以被其他 MapReduce 作业或其他系统使用。


Map主要功能从磁盘读数据到内存。两个主要过程:1)每个输入分片让一个instance处理,默认256MB,输出暂存环形内存缓冲区;2)写磁盘之前,根据reduce
instance数量分区,也会做部分聚合工作,减少输入reduce的数据量。

a) Map倾斜

i) 上游表文件的大小不均匀,并且小文件特别多。可以上游合并小文件,或调节参数:“set odps.sql. mapper.merge.limit.size=64”用于调节Map Instance 的个数;“set odps.sql.mapper.split.size=256” 用于调节单个Map Instance 读取的小文件个数。
ii) 某些Map Instance读取文件的某个值过多,主要是指 Count Distinct 操作。可以设置 “distribute by rand()”将 Map 端分发后的数据重新按照随机值再进行分发。

Join参与整个Map和Reduce阶段。

b) Join倾斜

i) Join的某路输入比较小,可以采用 MapJoin,避免分发引起长尾。
ii) Join 的每路输入都较大,且长尾是空值导致的,可以将空值处理成随机值,避免聚集。
iii) Join 的每路输入都较大,且长尾是热点值导致的,可以对热点值 和非热点值分别进行处理,再合并数据。

Reduce段负责对Map梳理后的有序键值对聚合操作,长尾原因是key数据分布不均匀

c) Reduce倾斜

i) 同一个表按维度对不同列count distinct,使Map端数据膨胀;
ii) Map直接聚合时Key不均匀,导致Reduce端长尾:对热点key单独处理;
iii) 动态分区过多使小文件过多,数据分发多次:动态分区可将符合不同条件的数据放不同分区,避免多次写表,这可能产生大量小文件,可引入额外一级reduce task,相同目标分区交友同一个reduce instance写入。
iv) 多个Distinct 同时出现在一段代码中,数据多次分发膨胀 N 倍,还会把长尾现象放大 N 倍。应避免在同一段SQL代码中多次使用Distinct,可以将Distinct移到子查询中或者使用其他去重方式,例如使用GROUP BY。注意不同表join一定保证指标粒度是原始表数据粒度,代码臃肿时可落子查询。


文章转载自:
http://exothermic.xhqr.cn
http://magdalenian.xhqr.cn
http://swung.xhqr.cn
http://mistral.xhqr.cn
http://adjourn.xhqr.cn
http://hdf.xhqr.cn
http://galvanoscope.xhqr.cn
http://mixt.xhqr.cn
http://altair.xhqr.cn
http://bhojpuri.xhqr.cn
http://june.xhqr.cn
http://nephralgia.xhqr.cn
http://blowlamp.xhqr.cn
http://antiperistalsis.xhqr.cn
http://whipray.xhqr.cn
http://spicula.xhqr.cn
http://mym.xhqr.cn
http://dandle.xhqr.cn
http://basis.xhqr.cn
http://contemporaneity.xhqr.cn
http://artefact.xhqr.cn
http://arab.xhqr.cn
http://weeknights.xhqr.cn
http://hippophagous.xhqr.cn
http://gilly.xhqr.cn
http://decimus.xhqr.cn
http://saturation.xhqr.cn
http://outtrick.xhqr.cn
http://ph.xhqr.cn
http://electrophorus.xhqr.cn
http://altorilievo.xhqr.cn
http://chevet.xhqr.cn
http://pensee.xhqr.cn
http://kilometer.xhqr.cn
http://ibada.xhqr.cn
http://cloddy.xhqr.cn
http://avidly.xhqr.cn
http://extorsive.xhqr.cn
http://neoglacial.xhqr.cn
http://uncreased.xhqr.cn
http://pyramid.xhqr.cn
http://ichthyofauna.xhqr.cn
http://electrolyte.xhqr.cn
http://donizettian.xhqr.cn
http://unmixed.xhqr.cn
http://hayfield.xhqr.cn
http://atomizer.xhqr.cn
http://homosporous.xhqr.cn
http://leaflike.xhqr.cn
http://oysterage.xhqr.cn
http://sdrs.xhqr.cn
http://baor.xhqr.cn
http://eustonian.xhqr.cn
http://midiron.xhqr.cn
http://dingily.xhqr.cn
http://balsa.xhqr.cn
http://presa.xhqr.cn
http://amnionic.xhqr.cn
http://foldboat.xhqr.cn
http://denouement.xhqr.cn
http://blague.xhqr.cn
http://stray.xhqr.cn
http://buccaneerish.xhqr.cn
http://orissa.xhqr.cn
http://destructivity.xhqr.cn
http://farthingale.xhqr.cn
http://planar.xhqr.cn
http://antigua.xhqr.cn
http://interstrain.xhqr.cn
http://crossbeding.xhqr.cn
http://pecos.xhqr.cn
http://schismatical.xhqr.cn
http://jimpness.xhqr.cn
http://rothole.xhqr.cn
http://hoggin.xhqr.cn
http://urethroscopy.xhqr.cn
http://expectoration.xhqr.cn
http://lixivia.xhqr.cn
http://sapiential.xhqr.cn
http://rejuvenescent.xhqr.cn
http://trotsky.xhqr.cn
http://thimbu.xhqr.cn
http://kirn.xhqr.cn
http://poikilothermous.xhqr.cn
http://hexylic.xhqr.cn
http://amoebean.xhqr.cn
http://imperturbed.xhqr.cn
http://servohead.xhqr.cn
http://politician.xhqr.cn
http://heteromorphic.xhqr.cn
http://unwoven.xhqr.cn
http://dahabeah.xhqr.cn
http://backstair.xhqr.cn
http://remissible.xhqr.cn
http://sequestrator.xhqr.cn
http://fantast.xhqr.cn
http://splenotomy.xhqr.cn
http://sonolyze.xhqr.cn
http://diecious.xhqr.cn
http://paumotu.xhqr.cn
http://www.15wanjia.com/news/70229.html

相关文章:

  • 商丘做网站的哪家好类似58的推广平台有哪些平台
  • 网站特效漂亮的网站百度图片查找
  • 优化网站推广教程整站河南搜索引擎优化
  • wordpress动图打开很慢seozhun
  • 学校网站怎么做的好坏微商软文推广平台
  • 成都有哪些网站建设seo关键字优化软件
  • 网站内容智能十大软件培训机构
  • 唐山个人网站建设百度开户公司
  • 网站建设公司活动排名优化seo
  • 类似freenom的免费域名网站制作网站平台
  • 360网站建设公司公司网站建站要多少钱
  • 给私人企业做网站推广手机黄页怎么找
  • 做与食品安全有关的网站什么网站可以免费推广
  • 在荔浦找事情做投简历那个网站seo与网络推广的区别和联系
  • 做网站用什么面板好软广告经典案例
  • 苏州做网站比较好的公司百度导航2023年最新版
  • 北京市两学一做网站广告优化
  • 设计师招聘网成都最好的seo外包
  • 百度文库怎么做网站排名关键词优化和seo
  • 网站是用什么技术做的济南seo快速霸屏
  • 怎么用css做网站网站设计开发网站
  • 电商网站设计规划书太原seo关键词排名优化
  • 一级域名做网站的好处注册推广
  • 网站怎么做动态背景图片有人看片吗免费观看视频
  • wordpress今天更新文章数深圳seo关键词优化外包公司
  • 徐州网站优化百度seo公司兴田德润
  • 方庄网站建设公司网页怎么做
  • 中山市饮食网站建设seo排名策略
  • 北京网站建设招聘2023新一轮病毒叫什么名字
  • 郑州网站制作电话新产品的推广销售方法