当前位置: 首页 > news >正文

手机创新网站网络seo外包

手机创新网站,网络seo外包,网站自己做流量,建立网站站点的步骤spark读取普通文件 txt文件 """ 将一行数据当做一个字段,需要自己切割 字段名称为value 表结构 可以从sql中搞 """ df spark.read.text("../../data/wordcount/input/data.txt") df spark.read.format("text"…

spark读取普通文件

txt文件

"""
将一行数据当做一个字段,需要自己切割 字段名称为value
表结构 可以从sql中搞
"""
df = spark.read.text("../../data/wordcount/input/data.txt")
df = spark.read.format("text").load("hdfs://shucang:9820/behavior/ads/ads_visit_type")df.createOrReplaceTempView("wordcount")

json文件

"""
读取json文件
直接就有表结构了
"""df1 = spark.read.format("json").load("../../resources/person.json").show()
df2 = spark.read.json("../../resources/person.json").show()

csv文件(固定分割符的文件)

"""
,分割符的文件 且含有表头
自动获取结构
"""
df = spark.read.format("csv").option("header",True).load("../../resources/homework1/3.txt")
"""
,分割符的文件 没有表头
获取结构的方式
"""
spark.read.csv("../../resources/homework1/3.txt")"""
:: 分隔符的文件
"""
df = spark.read.format("csv").option("sep","::").load("../../resources/input/movies.dat")
总结:
spark.read.format("json").load(path)
spark.read.format("csv").load(path)
spark.read.format("parquet").load(path)spark.read.json(path)
spark.read.csv(path)
spark.read.parquet(path)这都是一样的

创建表结构的方式

"""
按照"," 自动分割 列名为 _c0 _c1 _c2 
"""# 修改列名# 方式一:withColumnRenamed
df = spark.read.csv("../../resources/homework1/3.txt").withColumnRenamed("_c0","id") .withColumnRenamed("_c1","username").show()# 方式二:toDF("","") 和将RDD转为DF有区别 不加[]
df = spark.read.csv("../../resources/homework1/3.txt").toDF("id","username","math","computer","english")# 方式三:toDF的变种tupleA = ("id","username","math","computer","english")
df = spark.read.csv("../../resources/homework1/3.txt").toDF(*tupleA)# 方式四:这种和 rdd转为df的情况比较相似user_schema = StructType([StructField(name="emp_id", dataType=StringType(), nullable=False),StructField(name="emp_name", dataType=StringType(), nullable=True),StructField(name="salary", dataType=DoubleType(), nullable=True),StructField(name="comm", dataType=DoubleType(), nullable=True),StructField(name="dept_id", dataType=LongType(), nullable=True)])# 使用csv 读取了一个 \t 为分隔符的文件,读取的数据字段名很随意,所以可以自定义
df = spark.read.format("csv").option("sep","\t").load("../../datas/emp.tsv",schema=user_schema)# 创建一个表
df.createOrReplaceTempView("t_name")

http://www.15wanjia.com/news/5143.html

相关文章:

  • 黑龙江省网站前置审批网站企业网站是什么
  • 网片是干什么用的关键词排名优化营销推广
  • 镇江教育云网站建设搜索引擎排名中国
  • xmlrpc wordpress开启西安seo学院
  • 惠州市网站建设百度托管公司
  • 南浔区住房城乡建设局网站企业网站怎么做
  • 成都哪里做网站好百度推广客服电话多少
  • 建立网站 域名 服务器吗手机免费建站app
  • 青岛怎样做网站seo推广软件
  • app开发与网站开发seo网站优化快速排名软件
  • 网络云网站抖音seo搜索优化
  • 微信如何开发自己的小程序连云港seo公司
  • 邮件网站怎么做的seo外链怎么做能看到效果
  • 网站的建设及维护报告北京优化seo公司
  • 做招聘网站赚钱吗英文站友情链接去哪里查
  • 沈阳app制作网站建设推厦门做网站公司有哪些
  • 网站建设建议公司网站优化方案
  • php电子商务网站开发实例网络推广方法有几种
  • 网站建设5000费用预算网站外链的优化方法
  • 医院网站建设方案需要多少钱优化服务公司
  • 网站开发建设须知bt鹦鹉磁力
  • 有哪些设计软件网络推广seo是什么
  • wordpress怎么设置派送中免费seo搜索优化
  • 网站建站是 什么网站免费发布与推广
  • 沙河网站建设杭州网络推广
  • 工信部备案系统官网seo优化必备技巧
  • 网页游戏网站搭建国内新闻最近新闻今天
  • 一元购网站建设多少钱怎样做一个网站
  • 网页设计培训一般多少钱seol英文啥意思
  • 常见的导航网站有哪些seo专员工资一般多少