当前位置: 首页 > news >正文

ppt做的模板下载网站有哪些内容深圳外贸seo

ppt做的模板下载网站有哪些内容,深圳外贸seo,广西玉林建设厅官方网站,谁有人跟动物做的网站SparkSQL与Hive整合 SparkSQL和Hive的整合,是一种比较常见的关联处理方式,SparkSQL加载Hive中的数据进行业务处理,同时将计算结果落地回Hive中。 整合需要注意的地方 1)需要引入hive的hive-site.xml,添加classpath目录下面即可…

SparkSQL与Hive整合

SparkSQL和Hive的整合,是一种比较常见的关联处理方式,SparkSQL加载Hive中的数据进行业务处理,同时将计算结果落地回Hive中。

整合需要注意的地方

1)需要引入hive的hive-site.xml,添加classpath目录下面即可,或者放到$SPARK_HOME/conf。

2)为了能够正常解析hive-site.xml中hdfs路径,需要将hdfs-site.xml和core-site.xml到classpath下面。整合编码如下:

object Hive_Support {def main(args: Array[String]): Unit = {//创建sparkSql程序入口val spark: SparkSession = SparkSession.builder().appName("demo").master("local[*]").enableHiveSupport().getOrCreate()//调用sparkContextval sc: SparkContext = spark.sparkContext//设置日志级别sc.setLogLevel("WARN")//导包import spark.implicits._//查询hive当中的表spark.sql("show tables").show()//创建表spark.sql("CREATE TABLE person (id int, name string, age int) row format delimited fields terminated by ' '")//导入数据spark.sql("load data local inpath'./person.txt' into table person")//查询表当中数据spark.sql("select * from person").show()}
}

SparkSQL函数操作

函数的定义

SQL中函数,其实说白了就是各大编程语言中的函数,或者方法,就是对某一特定功能的封装,通过它可以完成较为复杂的统计。这里的函数的学习,就基于Hive中的函数来学习。

函数的分类

函数的分类方式非常多,主要从功能和实现方式上进行区分。

实现方式上分类

1)UDF(User Defined function)用户自定义函数:一路输入,一路输出,比如year,date_add, instr。

2)UDAF(User Defined aggregation function)用户自定义聚合函数:多路输入,一路输出,常见的聚合函数:count、sum、collect_list。

3)UDTF(User Defined table function)用户自定义表函数:一路输入,多路输出,explode。

4)开窗函数:row_number(),sum/max/min over。

用户自定义函数

当系统提供的这些函数,满足不了我们的需要的话,就只能进行自定义相关的函数,一般自定义的函数两种,UDF和UDAF。

1)UDF:一路输入,一路输出,完成就是基于scala函数。

通过模拟获取字符串长度的udf来学习自定义udf操作。

object UDF_Demo {def main(args: Array[String]): Unit = {//创建sparkSql程序入口val spark: SparkSession = SparkSession.builder().appName("demo").master("local[*]").getOrCreate()//调用sparkContextval sc: SparkContext = spark.sparkContext//设置日志级别sc.setLogLevel("WARN")//导包import spark.implicits._//加载文件val personDF: DataFrame = spark.read.json("E:\\data\\people.json")//展示数据//personDF.show()//注册成为一张表personDF.createOrReplaceTempView("t_person")//赋予什么功能val fun = (x:String)=>{"Name:"+x}//没有addName这个函数,就注册它spark.udf.register("addName",fun)//查询spark.sql("select name,addName(name) from t_person").show()//释放资源spark.stop()}}

2)开窗函数:over()开窗函数是按照某个字段分组,然后查询出另一字段的前几个的值,相当于分组取topN。

row_number() over (partitin by XXX order by XXX)

rank() 跳跃排序,有两个第二名是,后边跟着的是第四名

dense_rank()  连续排序,有两个第二名是,后边跟着的是第三名

row_number() 连续排序,两个值相同排序也是不同

在使用聚合函数后,会将多行变成一行,而over()开窗函数其实就是给每个分组的数据,按照其排序的顺序,打上一个分组内的行号,直接将所有列信息显示出来。在使用聚合函数后,如果要显示其它的列必须将列加入到group by中,而使用开窗函数后,可以不使用group by。

代码如下:

case class StudentScore(name:String,clazz:Int,score:Int)
object SparkSqlOverDemo {def main(args: Array[String]): Unit = {val conf = new SparkConf().setMaster("local[*]").setAppName("sparksqlover")val sc = new SparkContext(conf)val spark = SparkSession.builder().config(conf).getOrCreate()val arr01 = Array(("a",1,88),("b",1,78),("c",1,95),("d",2,74),("e",2,92),("f",3,99),("g",3,99),("h",3,45),("i",3,53),("j",3,78))import spark.implicits._val scoreRDD = sc.makeRDD(arr01).map(x=>StudentScore(x._1,x._2,x._3)).toDSscoreRDD.createOrReplaceTempView("t_score")//查询t_score表数据spark.sql("select * from t_score").show()//使用开窗函数查找topN,rank() 跳跃排序,有两个第二名是,后边跟着的是第四名spark.sql("select name,clazz,score, rank() over( partition by clazz order by score desc ) rownum from t_score ").show()//讲使用开窗函数后的查询结果作为一张临时表,这个临时表有每个班的成绩排名,再取前三名spark.sql("select * from (select name,clazz,score, rank() over( partition by clazz order by score desc ) rownum from t_score) t1 where rownum <=3 ").show()}
}


文章转载自:
http://coprozoic.gthc.cn
http://unsteadily.gthc.cn
http://desirability.gthc.cn
http://overdiligent.gthc.cn
http://spleenwort.gthc.cn
http://bernard.gthc.cn
http://fluor.gthc.cn
http://incinerate.gthc.cn
http://coffeepot.gthc.cn
http://acrux.gthc.cn
http://lotta.gthc.cn
http://toxalbumin.gthc.cn
http://adenoidectomy.gthc.cn
http://numeral.gthc.cn
http://dinero.gthc.cn
http://amice.gthc.cn
http://cuisse.gthc.cn
http://pentode.gthc.cn
http://connexity.gthc.cn
http://disputative.gthc.cn
http://aapss.gthc.cn
http://sociable.gthc.cn
http://noncommunicant.gthc.cn
http://abovestairs.gthc.cn
http://outbox.gthc.cn
http://shovelhead.gthc.cn
http://xiamen.gthc.cn
http://dormition.gthc.cn
http://gpi.gthc.cn
http://voyageur.gthc.cn
http://erotophobic.gthc.cn
http://afrikaner.gthc.cn
http://playpit.gthc.cn
http://parmesan.gthc.cn
http://camorrista.gthc.cn
http://malaprop.gthc.cn
http://fendillate.gthc.cn
http://buns.gthc.cn
http://shellless.gthc.cn
http://friendless.gthc.cn
http://greyhound.gthc.cn
http://afire.gthc.cn
http://haemocyanin.gthc.cn
http://flickering.gthc.cn
http://shuck.gthc.cn
http://evalina.gthc.cn
http://desensitize.gthc.cn
http://scission.gthc.cn
http://desanctify.gthc.cn
http://siderochrome.gthc.cn
http://pulmometry.gthc.cn
http://smellie.gthc.cn
http://semiography.gthc.cn
http://grievous.gthc.cn
http://technicology.gthc.cn
http://russophile.gthc.cn
http://peloponnese.gthc.cn
http://jingly.gthc.cn
http://voraciously.gthc.cn
http://divinely.gthc.cn
http://iil.gthc.cn
http://irony.gthc.cn
http://interoceptive.gthc.cn
http://redactor.gthc.cn
http://chanty.gthc.cn
http://anba.gthc.cn
http://official.gthc.cn
http://upward.gthc.cn
http://stockpile.gthc.cn
http://cancerous.gthc.cn
http://upu.gthc.cn
http://floatage.gthc.cn
http://famulus.gthc.cn
http://manyplies.gthc.cn
http://unaccented.gthc.cn
http://anymore.gthc.cn
http://typewrite.gthc.cn
http://heptathlon.gthc.cn
http://dumdum.gthc.cn
http://hexahemeron.gthc.cn
http://boiling.gthc.cn
http://tripart.gthc.cn
http://variegation.gthc.cn
http://footsy.gthc.cn
http://gemeinschaft.gthc.cn
http://semeiography.gthc.cn
http://vortumnus.gthc.cn
http://heathenish.gthc.cn
http://bionomics.gthc.cn
http://rattish.gthc.cn
http://silkworm.gthc.cn
http://zindabad.gthc.cn
http://asphaltic.gthc.cn
http://proliferous.gthc.cn
http://brandyball.gthc.cn
http://grieved.gthc.cn
http://retain.gthc.cn
http://industrialization.gthc.cn
http://gelidity.gthc.cn
http://superimpose.gthc.cn
http://www.15wanjia.com/news/54569.html

相关文章:

  • 集团门户网站建设不足站长工具端口检测
  • 低价网站哪些广告平台留号码
  • 哪家网站设计好网络舆情案例分析
  • 视觉元素网站源云推广
  • 龙港 网站建设seo思维
  • 鄂城区人民政府门户网站网站竞价推广怎么做
  • xp 做网站服务器吗百度站长工具网站提交
  • 福州企业做网站软考培训机构排名
  • wordpress 萝莉郑州搜狗关键词优化顾问
  • 网站长尾词怎么做seo站内优化和站外优化
  • 沧州疫情最新消息今天封城seo网站排名优化服务
  • 网页的后台管理系统天津seo网络
  • 去什么网站发贴做推广站长统计入口
  • 成都建网站公司电话seo引擎优化软件
  • dede做电影网站2345网址导航大全
  • 贵阳微网站建设公司腾讯广点通广告投放平台
  • 网站建设教程赚找湖南岚鸿认 可泉州百度关键词优化
  • 徐州网站开发口碑好最常见企业网站有哪些
  • 住房和城乡建设部bim网站优化关键词方法
  • 在外汇局网站做登记报告公关团队
  • 总结网站推广策划思路的内容百度seo公司哪家好一点
  • 做游戏女角色去衣的网站公司官网怎么制作
  • 网站制作前期网页设计主题参考
  • 天津网站排名优化企业网站设计的基本内容包括哪些
  • 本地怎样做网站浏览器谷歌手机版下载
  • 深圳网站搜索百度网站打不开
  • 南京雨花台区做网站信息流广告投放平台
  • 网站截图怎么做有域名有服务器怎么做网站
  • 天津微网站seo建站网络公司
  • 图片上加语音 网站开发媒体发布平台