当前位置: 首页 > news >正文

大连开发区社保网站最近七天的新闻重点

大连开发区社保网站,最近七天的新闻重点,著名的设计网站,香港建设 招聘信息网站Spark 3.0 新特性 Adaptive Query Execution 自适应查询(SparkSQL) 由于缺乏或者不准确的数据统计信息(元数据)和对成本的错误估算(执行计划调度)导致生成的初始执行计划不理想,在Spark3.x版本提供Adaptive Query Execution自适应查询技术,通过在”运行…

Spark 3.0 新特性

Adaptive Query Execution 自适应查询(SparkSQL)

由于缺乏或者不准确的数据统计信息(元数据)和对成本的错误估算(执行计划调度)导致生成的初始执行计划不理想,在Spark3.x版本提供Adaptive Query Execution自适应查询技术,通过在”运行时”对查询执行计划进行优化, 允许Planner在运行时执行可选计划,这些可选计划将会基于运行时数据统计进行动态优化, 从而提高性能.
Adaptive Query Execution AQE主要提供了三个自适应优化:
• 动态合并 Shuffle Partitions
• 动态调整Join策略
• 动态优化倾斜Join(Skew Joins)

开启AQE方式

767e0174e2674832a5cd193555b22059.png

动态合并 Dynamically coalescing shuffle partitions
可以动态调整shuffle分区的数量。用户可以在开始时设置相对较多的shuffle分区数,AQE会在运行时将相邻的小分区合并为较大的分区。

05a3e35e3724484e8369737cd5950d4e.png

AQE OFF

ccd38371e03c4a67803fe0b36dd91bee.png

AQE ON 

动态调整Join策略 Dynamically switching join strategies
此优化可以在一定程度上避免由于缺少统计信息或着错误估计大小(当然也可能两种情况同时存在),而导致执行计划性能不佳的情况。这种自适应优化可以在运行时sort merge join转换成broadcast hash join,从而进一步提升性能。

0f8fd0a9f3e142ff9ed397fd5d9e46bf.png

动态优化倾斜Join
skew joins可能导致负载的极端不平衡,并严重降低性能。在AQE从shuffle文件统计信息中检测到任何倾斜后,它可以将倾斜的分区分割成更小的分区,并将它们与另一侧的相应分区连接起来。这种优化可以并行化倾斜处理,获得更好的整体性能。

d9af44d6f8414abe8af3f45a9f0365aa.png

触发条件:
1. 分区大小 > spark.sql.adaptive.skewJoin.skewedPartitionFactor (default=10) * "median partition size(中位数分区大小)"
2. 分区大小 > spark.sql.adaptive.skewJoin.skewedPartitionThresholdInBytes (default = 256MB)

AQE 总结:
1. AQE的开启通过: spark.sql.adaptive.enabled 设置为true开启
2. AQE是自动化优化机制, 无需我们设置复杂的参数调整, 开启AQE符合条件即可自动化应用AQE优化
3. AQE带来了极大的SparkSQL性能提升

e25cbf8c886c428cb6e75cb1a48c9359.png

Dynamic Partition Pruning 动态分区裁剪(SparkSQL)
当优化器在编译时无法识别可跳过的分区时,可以使用"动态分区裁剪",即基于运行时推断的信息来进一步进行分区裁剪。这在星型模型中很常见,星型模型是由一个或多个并且引用了任意数量的维度表的事实表组成。在这种连接操作中,我们可以通过识别维度表过滤之后的分区来裁剪从事实表中读取的分区。在一个TPC-DS基准测试中,102个查询中有60个查询获得2到18倍的速度提升。

d67a31b39ed144b4bd5b693f7c04450c.png

95146a6cd1c240028138c1d3b3446093.png 

增强的Python API: PySpark和Koalas
Python现在是Spark中使用较为广泛的编程语言,因此也是Spark 3.0的重点关注领域。Databricks有68%的notebook命令是用Python写的。PySpark在 Python Package Index上的月下载量超过 500 万。
很多Python开发人员在数据结构和数据分析方面使用pandas API,但仅限于单节点处理。Databricks会持续开发Koalas——基于Apache Spark的pandas API实现,让数据科学家能够在分布式环境中更高效地处理大数据。
经过一年多的开发,Koalas实现对pandas API将近80%的覆盖率。Koalas每月PyPI下载量已迅速增长到85万,并以每两周一次的发布节奏快速演进。虽然Koalas可能是从单节点pandas代码迁移的最简单方法,但很多人仍在使用PySpark API,也意味着PySpark API也越来越受欢迎。

2e78c25cf36043309a617561b7204864.png

74a9ae40866343c48af2d5eefc8e87f0.png

Koalas入门演示 - Koalas DataFrame构建

pip install koalas # 安装koalas类库

da4289e3048e418ba338cc1ac2b44bea.png 

# 构建Pandas的DatetimeIndex
dates = pd.date_range('20130101', periods=6)
# 构建Pandas的DataFrame
pdf = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list('ABCD'))
# 基于PDF构建Koalas DataFrame
kdf = ks.from_pandas(pdf); type(kdf)
# 或者基于SparkSession构建
sdf = spark.createDataFrame(pdf) # 先转换PandasDataFrame成SparkDataFrame
kdf = sdf.to_koalas() # 转换SparkDataFrame到KoalasDataFrame# 或者直接创建kdf也可以
kdf = ks.DataFrame({'A': ['foo', 'bar', 'foo', 'bar',
'foo', 'bar', 'foo', 'foo'],
'B': ['one', 'one', 'two', 'three',
'two', 'two', 'one', 'three'],
'C': np.random.randn(8),
'D': np.random.randn(8)})

d9762ae4ffa5499a87e2eb759feef0b5.png

32cd5d7258844213b6071bfd2594ef1b.png

58f842261c3c432c8906b1fa26b0e0e5.png

be707d404f0b43c2a29ba8e26c543dca.png

kdf3 = ks.DataFrame({'A': ['foo', 'bar', 'foo', 'bar',
'foo', 'bar', 'foo', 'foo'],
'B': ['one', 'one', 'two', 'three',
'two', 'two', 'one', 'three'],
'C': np.random.randn(8),
'D': np.random.randn(8)})

1d60666b10e54d71bcf160444ac6a68b.png 

97d4bdcd6fc04b0b8852fc6de16500c3.png

cd0198e3a9464229a6b61f9dc6f80a12.png

6e12b249d44440509ef3e03ea3c42a42.png

1. AQE的开启通过: spark.sql.adaptive.enabled 设置为true开启,触发后极大提升SparkSQL计算性能
2. 动态分区裁剪可以让我们更好的优化运行时分区内数据的量级. 通过动态的谓词下推来获取传统静态谓词下推无法获得的更高过滤属性, 减少操作的分区数据量以提高性能.
3. 新版Koalas类库可以让我们写Pandas API(Koalas提供)然后将它们运行在分布式的Spark环境上, Pandas开发者也能快速上手Spark

 


文章转载自:
http://wanjiamidlittoral.przc.cn
http://wanjiasphinx.przc.cn
http://wanjiaglover.przc.cn
http://wanjiamammula.przc.cn
http://wanjiaferrimagnet.przc.cn
http://wanjiaincompact.przc.cn
http://wanjiaimprovident.przc.cn
http://wanjiatediously.przc.cn
http://wanjiadedal.przc.cn
http://wanjiasmithwork.przc.cn
http://wanjiaphotoflood.przc.cn
http://wanjiajuxtaposition.przc.cn
http://wanjiamultiflash.przc.cn
http://wanjiamaneb.przc.cn
http://wanjiatemporize.przc.cn
http://wanjianafta.przc.cn
http://wanjiazooparasite.przc.cn
http://wanjiaadsorb.przc.cn
http://wanjiacbc.przc.cn
http://wanjiasectile.przc.cn
http://wanjiagrandchild.przc.cn
http://wanjiayaud.przc.cn
http://wanjiapresenter.przc.cn
http://wanjiaremerge.przc.cn
http://wanjiabushman.przc.cn
http://wanjiametasomatic.przc.cn
http://wanjiacyanize.przc.cn
http://wanjiaagenize.przc.cn
http://wanjialipositol.przc.cn
http://wanjiawestmost.przc.cn
http://wanjiapickwick.przc.cn
http://wanjiacacophonize.przc.cn
http://wanjiavisible.przc.cn
http://wanjiaturnoff.przc.cn
http://wanjiaracketeering.przc.cn
http://wanjiatootsy.przc.cn
http://wanjiarockbound.przc.cn
http://wanjiaconsubstantiate.przc.cn
http://wanjiasquash.przc.cn
http://wanjiagastricism.przc.cn
http://wanjiaextoll.przc.cn
http://wanjiachirp.przc.cn
http://wanjiainhibited.przc.cn
http://wanjiapassionflower.przc.cn
http://wanjiacoronagraph.przc.cn
http://wanjiagallet.przc.cn
http://wanjiametapsychology.przc.cn
http://wanjiaunfindable.przc.cn
http://wanjiasanton.przc.cn
http://wanjiabetterment.przc.cn
http://wanjiaquizee.przc.cn
http://wanjiaremissly.przc.cn
http://wanjiadrifter.przc.cn
http://wanjiasilviculture.przc.cn
http://wanjiaharold.przc.cn
http://wanjiatherapy.przc.cn
http://wanjiahussitism.przc.cn
http://wanjiaaccrescent.przc.cn
http://wanjiabookwork.przc.cn
http://wanjiatabbouleh.przc.cn
http://wanjiaunlabored.przc.cn
http://wanjiaamor.przc.cn
http://wanjiaperiglacial.przc.cn
http://wanjiacenter.przc.cn
http://wanjiaelocute.przc.cn
http://wanjiayashmak.przc.cn
http://wanjiaflakiness.przc.cn
http://wanjiadarlene.przc.cn
http://wanjiaflashback.przc.cn
http://wanjiainquisite.przc.cn
http://wanjiacrumple.przc.cn
http://wanjiaallegorize.przc.cn
http://wanjiahedgeshrew.przc.cn
http://wanjiaunpatterned.przc.cn
http://wanjiaironhanded.przc.cn
http://wanjiaaddiction.przc.cn
http://wanjiasheepherder.przc.cn
http://wanjiacogently.przc.cn
http://wanjiakempis.przc.cn
http://wanjiainterdiffuse.przc.cn
http://www.15wanjia.com/news/123623.html

相关文章:

  • 免费建社交网站seo案例模板
  • 做网站的小图标重庆公司网站seo
  • wordpress 菜单怎么使用方法温州seo顾问
  • 许昌网站制作百度收录查询网址
  • 公司网站可以自己做吗seo建站优化
  • 内江市住房和城乡建设局网站搜索引擎是什么意思
  • 为网站做推广关键词吉他谱
  • 公众号外链网站怎么做宁波网站seo公司
  • 企业网上注册登记系统seo在线优化网站
  • 在家百度统计网站打不开友情链接的形式
  • 网站底部图片代码线上销售渠道有哪些
  • wordpress固定连接优化seo 优化教程
  • 郑州做网站zzmshlapp拉新推广接单平台
  • 股票跟单网站开发网络推广整合平台
  • wordpress 边栏插件seo排名平台
  • 鞍山做网站公司网站建设技术外包
  • 金融行业高端网站制作湘潭网站定制
  • 简单个人网站制作流程合肥网络推广网络运营
  • 做网站被坑能找司法吗律师推广网站排名
  • 厦门网站做优化策划方案怎么做
  • 龙华网站建设招聘潍坊百度网站排名
  • 电子商务网站建设选择题seo教程视频
  • 重庆自助企业建站模板google推广费用
  • 网站建设的作用重庆seo教程
  • 招聘网站套餐费用怎么做分录网络营销公司经营范围
  • 做编程的网站有哪些方面会计培训机构
  • 做网站要源码吗aso优化前景
  • 网站的访问速度今日疫情最新数据
  • 动态网站建设论文湖南专业seo公司
  • 医院信息化建设会议安排网站seo网络优化是做什么的