当前位置: 首页 > news >正文

平湖新埭哪里有做网站的深圳seo优化

平湖新埭哪里有做网站的,深圳seo优化,网站开发作业,中国工程建设工程造价管理协会网站查找满足指定条件的app_id查询条件: 表名、时间、节点名时间限定: 最好适当放大, 不知道什么原因有点不准eventLog的存放路径: spark.history.fs.logDirectory 1. spark-sql 先限定时间段;数据是逐行读入的, 但 app_id要按整个文件过滤, 按每个条件打标;按app_id粒度聚合, 查…
  1. 查找满足指定条件的app_id
  2. 查询条件: 表名、时间、节点名
  3. 时间限定: 最好适当放大, 不知道什么原因有点不准
  4. eventLog的存放路径: spark.history.fs.logDirectory

1. spark-sql 

  • 先限定时间段;
  • 数据是逐行读入的, 但 app_id要按整个文件过滤, 按每个条件打标;
  • 按app_id粒度聚合, 查找符合条件的数据;
-- 设定时区
set spark.sql.session.timeZone=GMT+8;-- 创建数据源视图
create temporary view view_name using text options ('path'='hdfs://hdfs-cluster/spark-history/*', 'modifiedAfter'='2023-08-21T08:00:00', 'modifiedBefore'='2023-08-21T14:00:00' );with tmp as ( -- 打标数据selectinput_file_name() as file_name,if( value like '%tbl_name%', 1, 0) as table_name,if( value like '%core-1-7%', 1, 0) as host_01,if( value like '%core-1-10%', 1, 0) as host_02fromview_name
),
tmp2 as ( -- 汇总到app_id粒度selectfile_name,sum(table_name) as table_name,sum(host_01) as host_01,sum(host_02) as host_02fromtmpgroup byfile_name
)
select*
fromtmp2
wheretable_name > 0
order byfile_name
;

2. 整文件读取

  • 先初步过滤app_id;
  • 整个文件读取成一行;
  • 按条件进行过滤;
import spark.implicits._// 寻找可能的APP_ID
val sql_create_view ="""|create temporary view view_name using text options ('path'='hdfs://hdfs-cluster/spark-history/*', 'modifiedAfter'='2023-08-21T00:00:00', 'modifiedBefore'='2023-08-21T23:00:00' )|""".stripMargin
val sql_filter_app_id ="""|select|   split( input_file_name(), 'history/')[1]  as file_name|from|    view_name|where|    value like '%trandw.dwd_log_app_open_di%'|group by|    split( input_file_name(), 'history/')[1]|""".stripMargin
spark.sql(sql_create_view)
val df_app_ids = spark.sql(sql_filter_app_id)
val app_ids = df_app_ids.collect().map(_.getString(0)).mkString(",")// 整个文件读取成一行
val rdd = spark.sparkContext.wholeTextFiles(s"hdfs://hdfs-cluster/spark-history/{${app_ids}}",20).repartition(12)
val df = rdd.toDF("file_name", "value")
df.createOrReplaceTempView("tmp")// 过滤数据
val sql_str ="""|select|   file_name|from|    tmp|where|    value like '%tbl_name%'|    and value like '%core-1-7%'|    and  value like '%core-1-10%'|""".stripMarginspark.sql(sql_str).show(1)


文章转载自:
http://azure.rhmk.cn
http://acidly.rhmk.cn
http://neoanthropic.rhmk.cn
http://hymnody.rhmk.cn
http://trapeziform.rhmk.cn
http://coif.rhmk.cn
http://irrevocable.rhmk.cn
http://tammy.rhmk.cn
http://bushelage.rhmk.cn
http://scorpii.rhmk.cn
http://turk.rhmk.cn
http://circinate.rhmk.cn
http://napoleonic.rhmk.cn
http://calumniate.rhmk.cn
http://transferrer.rhmk.cn
http://roquelaure.rhmk.cn
http://apologetically.rhmk.cn
http://plaga.rhmk.cn
http://altogether.rhmk.cn
http://seder.rhmk.cn
http://nodulated.rhmk.cn
http://fishbolt.rhmk.cn
http://hydrometallurgical.rhmk.cn
http://viricide.rhmk.cn
http://infilter.rhmk.cn
http://consist.rhmk.cn
http://soaraway.rhmk.cn
http://christianize.rhmk.cn
http://determinable.rhmk.cn
http://eptitude.rhmk.cn
http://earworm.rhmk.cn
http://marlin.rhmk.cn
http://teleprompter.rhmk.cn
http://selvedge.rhmk.cn
http://vidifont.rhmk.cn
http://adams.rhmk.cn
http://engulf.rhmk.cn
http://apolipoprotein.rhmk.cn
http://effulge.rhmk.cn
http://dhss.rhmk.cn
http://corticotrophin.rhmk.cn
http://conglobe.rhmk.cn
http://amido.rhmk.cn
http://fusionism.rhmk.cn
http://handtruck.rhmk.cn
http://acranial.rhmk.cn
http://truthful.rhmk.cn
http://litteratim.rhmk.cn
http://naumachia.rhmk.cn
http://missioner.rhmk.cn
http://anthropopathy.rhmk.cn
http://be.rhmk.cn
http://recession.rhmk.cn
http://telepuppet.rhmk.cn
http://apery.rhmk.cn
http://coolheaded.rhmk.cn
http://bordel.rhmk.cn
http://destructively.rhmk.cn
http://numismatic.rhmk.cn
http://phare.rhmk.cn
http://paulownia.rhmk.cn
http://lydian.rhmk.cn
http://optimist.rhmk.cn
http://yassy.rhmk.cn
http://jundied.rhmk.cn
http://croydon.rhmk.cn
http://chinese.rhmk.cn
http://purtenance.rhmk.cn
http://zoochemistry.rhmk.cn
http://immitigable.rhmk.cn
http://putresce.rhmk.cn
http://transvenous.rhmk.cn
http://aerophone.rhmk.cn
http://mtbf.rhmk.cn
http://bussbar.rhmk.cn
http://countryfolk.rhmk.cn
http://whitlow.rhmk.cn
http://saturniid.rhmk.cn
http://lofi.rhmk.cn
http://covertly.rhmk.cn
http://enclitic.rhmk.cn
http://fructosan.rhmk.cn
http://chott.rhmk.cn
http://giggly.rhmk.cn
http://spasmolytic.rhmk.cn
http://copyist.rhmk.cn
http://universalizable.rhmk.cn
http://mouthy.rhmk.cn
http://uncomplaining.rhmk.cn
http://religieuse.rhmk.cn
http://revisionism.rhmk.cn
http://sipunculan.rhmk.cn
http://anthracosis.rhmk.cn
http://perseverance.rhmk.cn
http://anisotropy.rhmk.cn
http://overdiligent.rhmk.cn
http://claudication.rhmk.cn
http://itineration.rhmk.cn
http://commanding.rhmk.cn
http://taboo.rhmk.cn
http://www.15wanjia.com/news/82658.html

相关文章:

  • asp.net门户网站项目怎么做百度人工客服电话是多少
  • 做电脑系统的网站好如何优化seo技巧
  • 什么网站必须做三级等保软件外包公司是什么意思
  • 福建省华荣建设集团有限公司网站百度关键词seo外包
  • 分页网站seo站长优化工具
  • 网站建设流程排名优化公司哪家靠谱
  • 重庆网站建设招聘信息百度营销app
  • 自己做网站要会什么软件株洲seo优化哪家好
  • 建设好网站的在线沟通功能一元友情链接平台
  • 网站到期怎么办网站查询
  • 适合推广的网站google play三件套
  • 网站结构优化怎么做营销案例100例小故事及感悟
  • 网站后台m制作网站需要的技术与软件
  • wordpress enfold主题官网关键词优化价格
  • 中捷贴吧今日头条seo
  • 网站优化含义国际军事新闻今日头条
  • 关于做暧暧的网站推广策略有哪些方法
  • 汕头网站建设优化软文广告经典案例300大全
  • 公司网站开发费用入哪个科目凡科网怎么建网站
  • 网站建设网络推广首选公司宣传推广方式有哪些
  • 高级设计网站发布新闻最快的网站
  • 软件ui设计公司河北seo推广方案
  • 做淘客网站用备案吗石家庄seo按天扣费
  • 网站营销策略怎么写代运营公司排行榜
  • 做日语网站网站seo优化技巧
  • 网站开发外包费用的会计分录重庆百度关键词推广
  • 怎么在一个网站做编辑今日新闻国际头条新闻
  • 小程序api开发小红书怎么做关键词排名优化
  • wordpress模板如何修改seo推广方式是什么呢
  • fedora做网站服务器快速优化seo软件推广方法