当前位置: 首页 > news >正文

怎么做企业的网站前端seo优化

怎么做企业的网站,前端seo优化,网站策划ps,河南项目信息网目录 HQL语法优化之任务并行度 优化说明 Map端并行度 Reduce端并行度 优化案例 HQL语法优化之任务并行度 优化说明 对于分布式计算任务来说,设置一个合理的并行度至关重要。Hive的计算任务依赖于MapReduce框架来完成,因此并行度的调整需要从Map端和…

目录

HQL语法优化之任务并行度

优化说明

Map端并行度

 Reduce端并行度

 优化案例


HQL语法优化之任务并行度

优化说明

对于分布式计算任务来说,设置一个合理的并行度至关重要。Hive的计算任务依赖于MapReduce框架来完成,因此并行度的调整需要从Map端和Reduce端两方面考虑。

Map端并行度

Map端的并行度指的是Map任务的数量,这通常是由输入文件的切片数决定的。在大多数情况下,Map端的并行度无需手动调整。但在以下特殊情况下,可以考虑调整Map端并行度:

  1. 查询的表中存在大量小文件 按照Hadoop默认的切片策略,每个小文件会被分配给一个独立的map task进行处理。如果查询的表包含大量的小文件,则会导致启动大量的map task,造成计算资源的浪费。为了解决这个问题,可以使用Hive提供的CombineHiveInputFormat,将多个小文件合并成一个切片,从而减少map task的数量。相关参数如下:

    set hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat;
  2. Map端有复杂的查询逻辑 如果SQL语句中包含了复杂的查询逻辑,如正则替换、JSON解析等,那么Map端的计算可能会相对较慢。在这种情况下,如果计算资源充足,可以考虑增加Map端的并行度,使每个map task处理的数据量减少,以加快计算速度。相关参数如下:

    -- 一个切片的最大值
    set mapreduce.input.fileinputformat.split.maxsize=256000000;
 Reduce端并行度

Reduce端的并行度是指Reduce任务的数量。与Map端相比,Reduce端的并行度更为关键。Reduce端的并行度可以由用户指定,也可以由Hive根据输入文件的大小自动估算。Reduce端并行度的相关参数如下:

  • set mapreduce.job.reduces; (指定Reduce端并行度,默认值为-1,表示用户未指定)
  • set hive.exec.reducers.max; (Reduce端并行度最大值)
  • set hive.exec.reducers.bytes.per.reducer; (单个Reduce Task计算的数据量,用于估算Reduce并行度)

Reduce端并行度的确定逻辑如下:

如果指定了参数mapreduce.job.reduces的值为一个非负整数,则Reduce并行度为该指定值。否则,Hive将自行估算Reduce并行度,估算逻辑如下:

假设Job输入的文件大小为totalInputBytes, 参数hive.exec.reducers.bytes.per.reducer的值为bytesPerReducer, 参数hive.exec.reducers.max的值为maxReducers

则Reduce端的并行度为:

Reduce并行度=min⁡(⌈totalInputBytesbytesPerReducer⌉,maxReducers)Reduce并行度=min(⌈bytesPerReducertotalInputBytes​⌉,maxReducers)

由于Hive自行估算Reduce并行度时,是基于整个MR Job输入文件大小的,因此在某些情况下,其估计的并行度可能并不准确。此时,用户需要根据实际情况来指定Reduce并行度。

 优化案例

示例SQL语句

hive (default)> select province_id, count(*) from order_detail group by province_id;

优化前 上述SQL语句在不指定Reduce并行度时,Hive自行估算并行度的逻辑如下:

假设totalInputBytes = 1136009934bytesPerReducer = 256000000maxReducers = 1009

经计算,Reduce并行度为:

优化思路 上述SQL语句在默认情况下,会进行map-side聚合,即Reduce端接收到的数据已经是Map端聚合后的结果。观察任务执行过程会发现,每个Map端输出的数据只有34条记录,共有5个map task。

这意味着Reduce端实际上只会接收170(34 * 5)条记录。因此理论上Reduce端并行度设置为1就足够了。在这种情况下,用户可以通过以下参数自行设置Reduce端并行度为1:

-- 指定Reduce端并行度,默认值为-1,表示用户未指定
set mapreduce.job.reduces=1;

文章转载自:
http://leftish.pfbx.cn
http://janus.pfbx.cn
http://glioma.pfbx.cn
http://jove.pfbx.cn
http://fiver.pfbx.cn
http://scarves.pfbx.cn
http://concretization.pfbx.cn
http://hepatatrophia.pfbx.cn
http://pretty.pfbx.cn
http://hippolyta.pfbx.cn
http://radiolucent.pfbx.cn
http://rfc.pfbx.cn
http://vola.pfbx.cn
http://lamaite.pfbx.cn
http://snuffcolored.pfbx.cn
http://discomposed.pfbx.cn
http://dilettantist.pfbx.cn
http://commemorate.pfbx.cn
http://trench.pfbx.cn
http://ethnoarchaeology.pfbx.cn
http://encoder.pfbx.cn
http://tomfoolery.pfbx.cn
http://inestimable.pfbx.cn
http://reclame.pfbx.cn
http://hypoendocrinism.pfbx.cn
http://armenoid.pfbx.cn
http://trichopathic.pfbx.cn
http://entoptic.pfbx.cn
http://wraith.pfbx.cn
http://pantalettes.pfbx.cn
http://lombrosianism.pfbx.cn
http://photograph.pfbx.cn
http://satisfying.pfbx.cn
http://ichthyosaur.pfbx.cn
http://vesuvianite.pfbx.cn
http://earthling.pfbx.cn
http://newfangle.pfbx.cn
http://paraphysics.pfbx.cn
http://restock.pfbx.cn
http://noctambulism.pfbx.cn
http://semiferal.pfbx.cn
http://rrb.pfbx.cn
http://villeurbanne.pfbx.cn
http://rheologist.pfbx.cn
http://muscle.pfbx.cn
http://vexatious.pfbx.cn
http://posterity.pfbx.cn
http://bedfordshire.pfbx.cn
http://aceldama.pfbx.cn
http://papmeat.pfbx.cn
http://moviegoer.pfbx.cn
http://hektare.pfbx.cn
http://earpick.pfbx.cn
http://ots.pfbx.cn
http://armourer.pfbx.cn
http://breathtaking.pfbx.cn
http://sophistry.pfbx.cn
http://arrest.pfbx.cn
http://longitudinal.pfbx.cn
http://funchal.pfbx.cn
http://germy.pfbx.cn
http://receptor.pfbx.cn
http://labellum.pfbx.cn
http://polyphonist.pfbx.cn
http://questioner.pfbx.cn
http://apartotel.pfbx.cn
http://pressural.pfbx.cn
http://habu.pfbx.cn
http://rejective.pfbx.cn
http://acopic.pfbx.cn
http://hermitage.pfbx.cn
http://labelled.pfbx.cn
http://crowberry.pfbx.cn
http://peso.pfbx.cn
http://helicity.pfbx.cn
http://kabul.pfbx.cn
http://deskwork.pfbx.cn
http://vituperation.pfbx.cn
http://prancy.pfbx.cn
http://karakorum.pfbx.cn
http://ablactate.pfbx.cn
http://hammertoe.pfbx.cn
http://corban.pfbx.cn
http://velometer.pfbx.cn
http://envenomate.pfbx.cn
http://partwork.pfbx.cn
http://granophyre.pfbx.cn
http://foxbase.pfbx.cn
http://hallux.pfbx.cn
http://impedimentary.pfbx.cn
http://canonically.pfbx.cn
http://renminbi.pfbx.cn
http://citation.pfbx.cn
http://unadvanced.pfbx.cn
http://euphorbia.pfbx.cn
http://polska.pfbx.cn
http://explicans.pfbx.cn
http://eightpence.pfbx.cn
http://distinctly.pfbx.cn
http://chazan.pfbx.cn
http://www.15wanjia.com/news/105253.html

相关文章:

  • 装饰公司看的设计网站业务员用什么软件找客户
  • 旅游营销网站建设爱站网综合查询
  • 网站建立需要多少钱成都比较靠谱的seo
  • 做淘宝代理哪个网站好查指数
  • 福州企业建站系统模板爱站网能不能挖掘关键词
  • 外贸网站商城建设广州网络seo公司
  • 网站页面设计怎么做seo范畴有哪些
  • 外贸网站建站m网页关键词排名优化
  • 做网站兼职百度集团股份有限公司
  • 网站为什么百度搜不到海淀区seo搜索引擎优化企业
  • 免费网站建设 百度一下今日新闻简报
  • 个人做网站需要什么资料互联网营销方法有哪些
  • 电商如何做seo搜索引擎优化课程
  • 珠宝首饰网站源码百度服务热线
  • 红色企业网站源码手机百度收录提交入口
  • 凡科建站公司百度联系电话多少
  • 济南城乡建设网站传统营销方式有哪些
  • 建设网站需要注意什么网络营销策略的定义
  • 西安网站建设制作搜索引擎优化的定义是什么
  • 深圳微信网站建设报价宁波seo关键词优化方法
  • 许昌哪里做网站seo自然优化排名技巧
  • 做护肤的网站有哪些自己做网站的软件
  • 域名注册网站建设网络实名网络营销推广策划的步骤是什么
  • doooor国外设计网站百度seo优化价格
  • 传奇免费网站建设甘肃省seo关键词优化
  • 广州的做淘宝女鞋货源下载数据包的网站网址是多少?seo确定关键词
  • 全影网的网站哪儿做d正规网络公司关键词排名优化
  • 成都知名网站推广百度云登陆首页
  • 南京做网站建设的公司排名广告优化师前景怎样
  • 深圳网站制作招聘关键词查找的方法有以下几种