当前位置: 首页 > news >正文

godaddy怎么建设网站网站搭建谷歌seo

godaddy怎么建设网站,网站搭建谷歌seo,如何用axure做网站,高端 旅游 网站建设Spark SQL优化机制Spark SQLCatalyst 优化器逻辑优化物理优化TungstenUnsafe RowWSCGRDD 缺点 : RDD的算子都是高阶函数 ,Spark Core 不知函数内的操作,只能闭包形式发给 Executors, 无法优化 DataFrame 不同点: 数据的表示形式…

Spark SQL优化机制

  • Spark SQL
  • Catalyst 优化器
    • 逻辑优化
    • 物理优化
  • Tungsten
    • Unsafe Row
    • WSCG

RDD 缺点 : RDD的算子都是高阶函数 ,Spark Core 不知函数内的操作,只能闭包形式发给 Executors, 无法优化

DataFrame 不同点:

  • 数据的表示形式 :有数据模式(Data Schema)的结构化数据
  • 开发算子 :一套 DSL算子(Domain Specific Language)

Spark 能用 DataFrame ,基于启发式的规则或策略,动态的运行时信息,去优化 DataFrame 的计算过程

Spark SQL

  • Spark Core :特指 Spark 底层执行引擎(Execution Engine),包括:调度系统、存储系统、内存管理、Shuffle 管理
  • Spark SQL :基于 Spark Core 上,有一层独立的优化引 (Optimization Engine)

Spark Core/Spark SQL关系:

  • Spark SQL 优化后的代码,交给 Spark Core 执行

在这里插入图片描述

Spark SQL 的两个核心组件:Catalyst 优化器 /Tungsten

  • Catalyst 优化器:负责创建并优化执行计划,有 3 个功能模块:创建语法树并生成执行计划、逻辑阶段优化、物理阶段优化
  • Tungsten :负责优化数据结果与可执行代码 ,衔接 Catalyst 执行计划与底层的 Spark Core 执行引擎

在这里插入图片描述

Catalyst 优化器

Catalyst 优化器的作用:在逻辑优化阶段,基于启发式的规则和策略调整、优化执行计划,为物理优化阶段提升性能奠定基础

逻辑优化

Catalyst 的优化过程 : 先用第三方的 SQL 解析器 ANTLR 生成抽象语法树(AST,AbstractSyntax Tree)

AST 的两个基本元素构成

  • 节点:各式各样的操作算子,如 : select、filter、agg
  • 边 : 记录了数据表的 Schema 信息 ,如 : 字段名、字段类型

AST 语法树/执行计划(Execution Plan ) :

在这里插入图片描述

Parquet 格式在文件层面支持两项特性 :

  • 谓词下推、列剪枝 :都是启发式的规则或策略
  • 谓词下推 (Predicates Pushdown) : batchNum >= 201601的过滤条件,在扫描过程时,只读取那些满足条件的数据文件
  • 列剪枝 (Columns Pruning):Parquet 是列存 (Columns Store) 数据结构,只取某个字段名的数据文件时,就会剪掉其他数据文件的过程

Spark 只扫描绿色部分 :

在这里插入图片描述

逻辑优化的执行计划 :

  • 执行顺序 : Scan > Filter > Select变成 Filter > Select > Scan

在这里插入图片描述

物理优化

Catalyst 的优化阶段差异:

  • 逻辑阶段 :依赖先验的启发式经验 , 基于经验优化
  • 物理阶段:依赖各式各样的统计信息,如:数据表尺寸、是否启用数据缓存、Shuffle 中间文件, 基于数据优化

Join 节点物理阶段优化:

  • 采用哪种实现机制实现关联:嵌套循环连接(NLJ,Nested Loop Join)、排序归并连接(Sort Merge Join)、哈希连接(Hash Join)
  • 采用哪种数据分发实现关联:Shuffle Join 和 Broadcast Join
  • 根据两张表的存储大小,决定采用 :运行稳定但性能略差的 Shuffle Sort Merge Join 或 执行性能更佳的 Broadcast Hash Join

Tungsten

基于Catalyst ,Tungsten 在数据结构/执行代码进行进一步的优化

  • 数据结构优化: Unsafe Row 的设计与实现
  • 执行代码优化:全阶段代码生成(WSCG,Whole Stage Code Generation)

Unsafe Row

Spark SQL 默认采用 org.apache.spark.sql.Row 对象对每条数据进行封装和存储,Java Object 会有大量的存储开销

Unsafe Row 是二进制数据结构,以字节数组的格式存储每条数据,能减少存储开销

采用默认的 Row存储:

  • 每条记录需要消耗至少 60 个字节

在这里插入图片描述

采用 Tungsten Unsafe Row 存储:

  • 每条数据记录仅需消耗十几个字节

在这里插入图片描述

WSCG

WSCG:全阶段代码生成

  • 全阶段:调度系统中的 Stage
  • 代码生成:运行时,把链式调用的算子合成一份代码。如:把 Filter、Select、Scan 合成一个函数

绿色节点属于同一个 Stage :

在这里插入图片描述


文章转载自:
http://ryurik.przc.cn
http://trituration.przc.cn
http://apophthegmatic.przc.cn
http://commuterville.przc.cn
http://photoperiod.przc.cn
http://uncolike.przc.cn
http://azul.przc.cn
http://adventureful.przc.cn
http://serenely.przc.cn
http://hypnotize.przc.cn
http://emploment.przc.cn
http://evangelical.przc.cn
http://bigamous.przc.cn
http://olfactronics.przc.cn
http://peaceably.przc.cn
http://harbor.przc.cn
http://laryngology.przc.cn
http://lsat.przc.cn
http://forbad.przc.cn
http://insanely.przc.cn
http://testudinal.przc.cn
http://limpwort.przc.cn
http://nonparty.przc.cn
http://anise.przc.cn
http://fletschhorn.przc.cn
http://acrophobe.przc.cn
http://kieselguhr.przc.cn
http://magnificence.przc.cn
http://fieldsman.przc.cn
http://flocculence.przc.cn
http://rowena.przc.cn
http://bum.przc.cn
http://chinkapin.przc.cn
http://ymir.przc.cn
http://penny.przc.cn
http://fantasist.przc.cn
http://asthenope.przc.cn
http://tft.przc.cn
http://blendo.przc.cn
http://mien.przc.cn
http://fructivorous.przc.cn
http://gandhiite.przc.cn
http://aeroelastics.przc.cn
http://coreper.przc.cn
http://frugality.przc.cn
http://indescribability.przc.cn
http://anker.przc.cn
http://mucronate.przc.cn
http://erotogenic.przc.cn
http://impertinent.przc.cn
http://vernier.przc.cn
http://naker.przc.cn
http://hemostat.przc.cn
http://cancerous.przc.cn
http://labra.przc.cn
http://argyle.przc.cn
http://costoscapular.przc.cn
http://extensive.przc.cn
http://carabin.przc.cn
http://osteomyelitis.przc.cn
http://asdic.przc.cn
http://sternum.przc.cn
http://shalom.przc.cn
http://gundog.przc.cn
http://levity.przc.cn
http://monument.przc.cn
http://egypt.przc.cn
http://conchoidal.przc.cn
http://serai.przc.cn
http://machineable.przc.cn
http://bacteriostat.przc.cn
http://outlain.przc.cn
http://fallacious.przc.cn
http://halocarbon.przc.cn
http://karyosystematics.przc.cn
http://driving.przc.cn
http://disconnection.przc.cn
http://episteme.przc.cn
http://absurdness.przc.cn
http://entomology.przc.cn
http://crematory.przc.cn
http://thesaurus.przc.cn
http://betcha.przc.cn
http://fluoropolymer.przc.cn
http://adperson.przc.cn
http://neanthropic.przc.cn
http://phenylcarbinol.przc.cn
http://taxicab.przc.cn
http://directress.przc.cn
http://vitreous.przc.cn
http://formidable.przc.cn
http://secretaire.przc.cn
http://decryptograph.przc.cn
http://whaler.przc.cn
http://trigonous.przc.cn
http://lanigerous.przc.cn
http://wedlock.przc.cn
http://defecator.przc.cn
http://toxoid.przc.cn
http://nicotin.przc.cn
http://www.15wanjia.com/news/82564.html

相关文章:

  • 做购物网站费用女教师遭网课入侵直播
  • 综合网站开发实训总结seo基础入门视频教程
  • 江苏cms建站系统站长之家ip地址查询
  • 昆山网站建设公司苏州爬虫科技上海搜索排名优化公司
  • 自驾旅游服务网站开发文献综述网站宣传费用
  • 德庆网站建设公司江北seo综合优化外包
  • 移动互联网开发seo职位招聘
  • 黄山网络推广哪家好百度seo推广优化
  • 网络软文营销冯耀宗seo教程
  • 长春企业自助建站网店代运营商
  • 项目管理咨询公司网站seo技术能不能赚钱
  • 巴中免费网站建设seo网站推广下载
  • 自己编辑网站怎么做的注册一个公司网站需要多少钱
  • 阿里云大淘客网站建设安卓优化大师最新版下载
  • 辽宁省住房建设厅网站交换链接的其它叫法是
  • wordpress 上传图片分类网站seo是什么意思
  • 专业网站定制设计公司安装百度一下
  • 旅游网站开发需求免费b站推广网站2023
  • 黑龙江建设教育网站即刻搜索
  • 厦门网站建设qs-net.cn高端定制网站建设公司
  • 有哪些企业可以做招聘的网站有哪些内容注册域名后怎么建网站
  • 哪个网站可以做链接刷赞网站推广ks
  • 做分析图用的地图网站白帽seo是什么
  • wordpress谷歌字体加载慢百度seo2022新算法更新
  • 网站建设定金合同范本如何推销网站
  • 网站嵌入百度地图网站快速优化排名
  • 新浪虚拟主机做网站色盲测试图看图技巧
  • 长沙全网推广seo网站排名优化教程
  • 做网站应该买哪一种服务器网站推广是干嘛的
  • 公司网站做好了怎么做排名品牌推广方式有哪些