当前位置: 首页 > news >正文

tp3.2.3网站开发实例亿级流量网站架构

tp3.2.3网站开发实例,亿级流量网站架构,推广公司让实名认证怎么办,注册公司域名后如何做网站背景: 数据中台项目使用Spark+Hive+Paimon做湖仓底层,调度任务使用的是基于Dolphinscheduler进行二开。在做离线脚本任务开发时,在Paimon库下执行非查询类SQL报错。 INSERT报错 DELETE报错 现状: 原始逻辑为数据中台中选择的Paimon数据源,实际上在Dolphinscheduler中是…

背景:

数据中台项目使用Spark+Hive+Paimon做湖仓底层,调度任务使用的是基于Dolphinscheduler进行二开。在做离线脚本任务开发时,在Paimon库下执行非查询类SQL报错。

INSERT报错

DELETE报错

 现状:

原始逻辑为数据中台中选择的Paimon数据源,实际上在Dolphinscheduler中是选择的Hive数据源。所以在Dolphinscheduler中,实际上是选择了一个SQL类型的任务节点,数据原类型选择Hive。执行后就会报以上两个错误。

排查思路以及解决方案:

在这种多组件复杂环境的情况下去排查问题,需要分段排查。首先确认是否是数据中台代码的问题。

1. 脱离数据中台直接在Dolphinscheduler创建一个工作流,任务节点选择SQL,选择Hive数据源执行insert代码。发现是同样的报错。

所以可以先排除是数据中台在创建Dolphinscheduler工作流的问题,但这不代表原逻辑正确。

2. Dolphinscheduler只是一个调度,除非是他无法实现这个功能,基本上不会出现问题,所以继续向下排查。

3. 排查Spark+Hive+Paimon

分别来看一下这三个组件在数据中台中的作用

Spark+Hive

在我们的中台中,是Spark on Hive 是Hive只作为存储角色,Spark负责sql解析优化,执行。也就是Spark 通过Spark SQL 使用Hive 语句操作Hive表 ,底层运行的还是 Spark RDD。

具体步骤如下:

  • 通过SparkSQL,加载Hive的配置文件,获取到

http://www.15wanjia.com/news/181399.html

相关文章:

  • 美妆企业网站模板学编程的基础要具备什么
  • 建站网站珠海网站制作哪家便宜
  • app网站制作软件有哪些做100个网站
  • 网站右键禁止生活中好的设计产品
  • 济南市网站推广公司第三方app下载平台
  • 做短视频网站好城市建设规划网站
  • 手机网站展示微商推广网站怎么做
  • 深圳成品网站超市国外商业网站
  • 怎么做婚庆网站平台兴宁市住房和城乡建设部网站
  • 惠州网络公司网站建设网络舆情现状分析
  • 网站快捷导航ie怎么做微信营销的方式有哪些
  • 巡视组 住房与城乡建设部网站wordpress企业新闻
  • 自适应网站 与响应式重庆有什么好玩的地方景点介绍
  • 学做网站需要掌握哪些知识wordpress能做流量站吗
  • 建立网站需要多少钱怎么样功能型网站建设
  • 做网站经常用的术语专业的环保行业网站开发
  • 网站推广推广宁波网站建设公司比较好
  • 经营性质的网站新浪云安装wordpress
  • 网站建设 视频教程网站开发需要会什么软件
  • 做网站题材代写文案平台
  • wordpress适合外贸站wordpress网站分享朋友圈缩略图
  • 共享虚拟主机 几个网站大连大型网站制作公司
  • 遵化市有做奇麟网站的吗房地产开发公司招聘岗位
  • 网站防采集导入表格数据做地图网站
  • 自己做网站挂广告怎么赚钱欧美网站模板
  • 如何建设购物网站注册公司需要什么条件和手续
  • wordpress建什么站软文案例300字
  • 哪个大学的网站做的最好看瓯网
  • 男女做床上网站北京网站建设 专业10年
  • 网上服装商城网站建设方案策划宋祖儿在哪个网站做网红