当前位置: 首页 > news >正文

服装公司网站源码免费制作app生成器网站

服装公司网站源码,免费制作app生成器网站,建设银行信用卡网站登录,公司画册当分区由多变少时,不需要shuffle,也就是父RDD与子RDD之间是窄依赖。 当分区由少变多时,是需要shuffle的。 但极端情况下(1000个分区变成1个分区),这时如果将shuffle设置为false,父子RDD是窄依赖关系&…

当分区由多变少时,不需要shuffle,也就是父RDD与子RDD之间是窄依赖

当分区由少变多时,是需要shuffle的。

但极端情况下(1000个分区变成1个分区),这时如果将shuffle设置为false,父子RDD是窄依赖关系,他们同处在一个Stage中,就可能造成spark程序的并行度不够,从而影响性能,如果1000个分区变成1个分区,为了使coalesce之前的操作有更好的并行度,可以将shuffle设置为true。

scala> val arr = Array(1,2,3,4,5,6,7,8,9)
arr: Array[Int] = Array(1, 2, 3, 4, 5, 6, 7, 8, 9)scala> sc.makeRDD(arr,3)
res12: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[14] at makeRDD at <console>:27scala> res12.coalesce(2)
res13: org.apache.spark.rdd.RDD[Int] = CoalescedRDD[15] at coalesce at <console>:26scala> res13.partitions.size 
res14: Int = 2scala> res12.coalesce(12)
res15: org.apache.spark.rdd.RDD[Int] = CoalescedRDD[16] at coalesce at <console>:26scala> res15.partitions.size
res16: Int = 3scala> res12.repartition(2)
res17: org.apache.spark.rdd.RDD[Int] = MapPartitionsRDD[20] at repartition at <console>:26scala> res17.partitions.size
res18: Int = 2scala> res12.repartition(12)
res19: org.apache.spark.rdd.RDD[Int] = MapPartitionsRDD[24] at repartition at <console>:26scala> res19.partitions.size
res20: Int = 12

repartition算子底层调用的是coalesce算子。且shuffle指定了值为true。一定会发生shuffle阶段。

repartition带有shuffle可以增加也可以减少。shuffle参数指定为true,即一定会发生shuffle阶段。

coalesce算子只能减少不能增加。由于coalesce的shuffle默认false。

例子:

如果说一个阶段中存在union或者是coalesce算子会出现rdd的分区数量变化,但是没有shuffle的情况,看最后的rdd的分区个数就是当前阶段的task任务的个数

coalesce算子并没有发生shuffle,没有划分stage。但reduceByKey产生了shuffle,所以应该划分stage。

http://www.15wanjia.com/news/190197.html

相关文章:

  • 成华区建设局质检站网站产品软文范例软文
  • 企业公司网站免费正规大数据查询平台
  • 开发网站如何选需要首钢建设二建设公司网站
  • 哪个市文化和旅游网站做的好ih5网页制作教程
  • 常熟有哪些网站建设公司十大app黄皮软件排行榜
  • 网站设置不可粘贴网站建设盈利
  • 024 网站推广网站 建设标准
  • 搭建网站需要什么技术电商分销平台
  • 建设网站目的是什么如何建设网站安全管理制度
  • 有没有免费开网站的固安做网站的
  • 网站开发详细流程无锡网站seo顾问
  • 做网站刷QQ会员网站巢湖城市建设投资有限公司网站
  • 网站的地图要怎么做网站开发外包维护合同
  • 桂林微物网络科技有限公司东莞神马seo推广排名
  • 谷歌网站收录提交入口什么是响应式设计
  • wordpress幻灯片太卡seo如何优化
  • 模块化网站建设 局域网邢台做移动网站公司电话
  • 电商网站后台管理系统做开锁推广什么网站好
  • 百度收录网站收费吗qq邮箱登录入口网页版
  • 做公司网站 烟台广州个人做网站
  • 公司网站建设计入明细科目左侧导航栏网站模板
  • 要写网站建设方案wordpress 短信发送
  • py怎么做网站第一个做装修的网站
  • 惠州 网站建设深圳物流公司查询大全
  • 菜鸟教程网站建设做推广哪个网站最热门
  • 厦门翔安建设局网站东莞seo优化培训
  • 烟台专业网站建设公司哪家好学做网站基础知识
  • 网站制作用什么软件开封美食网站建设规划
  • 上海网站备案信息注销深圳市企业网站建设
  • 建立主题网站的顺序是1m宽带做网站