当前位置: 首页 > news >正文

网站建设中图片电话厦门关键词排名优化

网站建设中图片电话,厦门关键词排名优化,wordpress 多主题插件下载,做模版网站需要租服务器吗文章目录 一、RDD#sortBy 方法1、RDD#sortBy 语法简介2、RDD#sortBy 传入的函数参数分析 二、代码示例 - RDD#sortBy 示例1、需求分析2、代码示例3、执行结果 一、RDD#sortBy 方法 1、RDD#sortBy 语法简介 RDD#sortBy 方法 用于 按照 指定的 键 对 RDD 中的元素进行排序 , 该方…

文章目录

  • 一、RDD#sortBy 方法
    • 1、RDD#sortBy 语法简介
    • 2、RDD#sortBy 传入的函数参数分析
  • 二、代码示例 - RDD#sortBy 示例
    • 1、需求分析
    • 2、代码示例
    • 3、执行结果





一、RDD#sortBy 方法




1、RDD#sortBy 语法简介


RDD#sortBy 方法 用于 按照 指定的 键 对 RDD 中的元素进行排序 , 该方法 接受一个 函数 作为 参数 , 该函数从 RDD 中的每个元素提取 排序键 ;

根据 传入 sortBy 方法 的 函数参数 和 其它参数 , 将 RDD 中的元素按 升序 或 降序 进行排序 , 同时还可以指定 新的 RDD 对象的 分区数 ;


RDD#sortBy 语法 :

sortBy(f: (T) ⇒ U, ascending: Boolean, numPartitions: Int): RDD[T]
  • 参数说明 :
    • f: (T) ⇒ U 参数 : 函数 或 lambda 匿名函数 , 用于 指定 RDD 中的每个元素 的 排序键 ;
    • ascending: Boolean 参数 : 排序的升降设置 , True 生序排序 , False 降序排序 ;
    • numPartitions: Int 参数 : 设置 排序结果 ( 新的 RDD 对象 ) 中的 分区数 ;
      • 当前没有接触到分布式 , 将该参数设置为 1 即可 , 排序完毕后是全局有序的 ;
  • 返回值说明 : 返回一个新的 RDD 对象 , 其中的元素是 按照指定的 排序键 进行排序的结果 ;

2、RDD#sortBy 传入的函数参数分析


RDD#sortBy 传入的函数参数 类型为 :

(T) ⇒ U

T 是泛型 , 表示传入的参数类型可以是任意类型 ;

U 也是泛型 , 表示 函数 返回值 的类型 可以是任意类型 ;

T 类型的参数 和 U 类型的返回值 , 可以是相同的类型 , 也可以是不同的类型 ;





二、代码示例 - RDD#sortBy 示例




1、需求分析


统计 文本文件 word.txt 中出现的每个单词的个数 , 并且为每个单词出现的次数进行排序 ;

Tom Jerry
Tom Jerry Tom
Jack Jerry Jack Tom

在这里插入图片描述

读取文件中的内容 , 统计文件中单词的个数并排序 ;

思路 :

  • 读取数据到 RDD 中 ,
  • 然后 按照空格分割开 再展平 , 获取到每个单词 ,
  • 根据上述单词列表 , 生成一个 二元元组 列表 , 列表中每个元素的 键 Key 为单词 , 值 Value 为 数字 1 ,
  • 对上述 二元元组 列表 进行 聚合操作 , 相同的 键 Key 对应的 值 Value 进行相加 ;
  • 将聚合后的结果的 单词出现次数作为 排序键 进行排序 , 按照升序进行排序 ;

2、代码示例


对 RDD 数据进行排序的核心代码如下 :

# 对 rdd4 中的数据进行排序
rdd5 = rdd4.sortBy(lambda element: element[1], ascending=True, numPartitions=1)

要排序的数据如下 :

[('Tom', 4), ('Jack', 2), ('Jerry', 3)]

按照上述二元元素的 第二个 元素 进行排序 , 对应的 lambda 表达式为 :

lambda element: element[1]

ascending=True 表示升序排序 ,

numPartitions=1 表示分区个数为 1 ;


排序后的结果为 :

[('Jack', 2), ('Jerry', 3), ('Tom', 4)]

代码示例 :

"""
PySpark 数据处理
"""# 导入 PySpark 相关包
from pyspark import SparkConf, SparkContext
# 为 PySpark 配置 Python 解释器
import os
os.environ['PYSPARK_PYTHON'] = "D:/001_Develop/022_Python/Python39/python.exe"# 创建 SparkConf 实例对象 , 该对象用于配置 Spark 任务
# setMaster("local[*]") 表示在单机模式下 本机运行
# setAppName("hello_spark") 是给 Spark 程序起一个名字
sparkConf = SparkConf() \.setMaster("local[*]") \.setAppName("hello_spark")# 创建 PySpark 执行环境 入口对象
sparkContext = SparkContext(conf=sparkConf)# 打印 PySpark 版本号
print("PySpark 版本号 : ", sparkContext.version)# 将 文件 转为 RDD 对象
rdd = sparkContext.textFile("word.txt")
print("查看文件内容 : ", rdd.collect())# 通过 flatMap 展平文件, 先按照 空格 切割每行数据为 字符串 列表
#   然后展平数据解除嵌套
rdd2 = rdd.flatMap(lambda element: element.split(" "))
print("查看文件内容展平效果 : ", rdd2.collect())# 将 rdd 数据 的 列表中的元素 转为二元元组, 第二个元素设置为 1
rdd3 = rdd2.map(lambda element: (element, 1))
print("转为二元元组效果 : ", rdd3.collect())# 应用 reduceByKey 操作,
#   将同一个 Key 下的 Value 相加, 也就是统计 键 Key 的个数
rdd4 = rdd3.reduceByKey(lambda a, b: a + b)
print("统计单词 : ", rdd4.collect())# 对 rdd4 中的数据进行排序
rdd5 = rdd4.sortBy(lambda element: element[1], ascending=True, numPartitions=1)
print("最终统计单词并排序 : ", rdd4.collect())# 停止 PySpark 程序
sparkContext.stop()

3、执行结果


执行结果 :

D:\001_Develop\022_Python\Python39\python.exe D:/002_Project/011_Python/HelloPython/Client.py
23/08/04 10:49:06 WARN Shell: Did not find winutils.exe: java.io.FileNotFoundException: Could not locate Hadoop executable: D:\001_Develop\052_Hadoop\hadoop-3.3.4\bin\winutils.exe -see https://wiki.apache.org/hadoop/WindowsProblems
Setting default log level to "WARN".
To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel).
PySpark 版本号 :  3.4.1
查看文件内容 :  ['Tom Jerry', 'Tom Jerry Tom', 'Jack Jerry Jack Tom']
查看文件内容展平效果 :  ['Tom', 'Jerry', 'Tom', 'Jerry', 'Tom', 'Jack', 'Jerry', 'Jack', 'Tom']
转为二元元组效果 :  [('Tom', 1), ('Jerry', 1), ('Tom', 1), ('Jerry', 1), ('Tom', 1), ('Jack', 1), ('Jerry', 1), ('Jack', 1), ('Tom', 1)]
D:\001_Develop\022_Python\Python39\Lib\site-packages\pyspark\python\lib\pyspark.zip\pyspark\shuffle.py:65: UserWarning: Please install psutil to have better support with spilling
D:\001_Develop\022_Python\Python39\Lib\site-packages\pyspark\python\lib\pyspark.zip\pyspark\shuffle.py:65: UserWarning: Please install psutil to have better support with spilling
D:\001_Develop\022_Python\Python39\Lib\site-packages\pyspark\python\lib\pyspark.zip\pyspark\shuffle.py:65: UserWarning: Please install psutil to have better support with spilling
D:\001_Develop\022_Python\Python39\Lib\site-packages\pyspark\python\lib\pyspark.zip\pyspark\shuffle.py:65: UserWarning: Please install psutil to have better support with spilling
统计单词 :  [('Tom', 4), ('Jack', 2), ('Jerry', 3)]
D:\001_Develop\022_Python\Python39\Lib\site-packages\pyspark\python\lib\pyspark.zip\pyspark\shuffle.py:65: UserWarning: Please install psutil to have better support with spilling
D:\001_Develop\022_Python\Python39\Lib\site-packages\pyspark\python\lib\pyspark.zip\pyspark\shuffle.py:65: UserWarning: Please install psutil to have better support with spilling
最终统计单词并排序 :  [('Jack', 2), ('Jerry', 3), ('Tom', 4)]Process finished with exit code 0

在这里插入图片描述


文章转载自:
http://balsamiferous.spkw.cn
http://hordein.spkw.cn
http://ming.spkw.cn
http://voter.spkw.cn
http://myelinated.spkw.cn
http://euciliate.spkw.cn
http://knit.spkw.cn
http://brickmason.spkw.cn
http://immerge.spkw.cn
http://yellowbill.spkw.cn
http://laryngotracheitis.spkw.cn
http://domesticate.spkw.cn
http://blackhearted.spkw.cn
http://playfully.spkw.cn
http://phrenic.spkw.cn
http://anthracnose.spkw.cn
http://internship.spkw.cn
http://baboon.spkw.cn
http://blacketeer.spkw.cn
http://gardening.spkw.cn
http://lee.spkw.cn
http://baggagemaster.spkw.cn
http://neanderthalic.spkw.cn
http://flatling.spkw.cn
http://airplay.spkw.cn
http://strained.spkw.cn
http://epithalamia.spkw.cn
http://ferrite.spkw.cn
http://misventure.spkw.cn
http://tobago.spkw.cn
http://douane.spkw.cn
http://gottland.spkw.cn
http://zeugmatic.spkw.cn
http://hallali.spkw.cn
http://anthropogeny.spkw.cn
http://oreology.spkw.cn
http://diplomatist.spkw.cn
http://electrocoagulation.spkw.cn
http://donald.spkw.cn
http://realizingly.spkw.cn
http://cardsharper.spkw.cn
http://autochthonal.spkw.cn
http://yeah.spkw.cn
http://ophthalmoplegia.spkw.cn
http://depeople.spkw.cn
http://dactylic.spkw.cn
http://harborer.spkw.cn
http://erythrochroism.spkw.cn
http://zincification.spkw.cn
http://paita.spkw.cn
http://sudanese.spkw.cn
http://parlement.spkw.cn
http://mridang.spkw.cn
http://paramour.spkw.cn
http://squawk.spkw.cn
http://kench.spkw.cn
http://glomus.spkw.cn
http://vesa.spkw.cn
http://skelp.spkw.cn
http://revolution.spkw.cn
http://sacrosciatic.spkw.cn
http://prometal.spkw.cn
http://bubbleheaded.spkw.cn
http://rhinestone.spkw.cn
http://cartridge.spkw.cn
http://caprine.spkw.cn
http://yaqui.spkw.cn
http://zoosporangium.spkw.cn
http://frisket.spkw.cn
http://thorianite.spkw.cn
http://lilylike.spkw.cn
http://le.spkw.cn
http://strenuously.spkw.cn
http://overpower.spkw.cn
http://euthanize.spkw.cn
http://skerrick.spkw.cn
http://municipally.spkw.cn
http://idoneous.spkw.cn
http://privative.spkw.cn
http://mortgage.spkw.cn
http://uppercase.spkw.cn
http://rale.spkw.cn
http://atmometric.spkw.cn
http://unskillfully.spkw.cn
http://antipyrin.spkw.cn
http://tzarist.spkw.cn
http://aerogenic.spkw.cn
http://fishfag.spkw.cn
http://mcps.spkw.cn
http://swamy.spkw.cn
http://xpvm.spkw.cn
http://pointy.spkw.cn
http://stan.spkw.cn
http://fruitful.spkw.cn
http://biparietal.spkw.cn
http://anfractuous.spkw.cn
http://shootable.spkw.cn
http://formular.spkw.cn
http://anandrous.spkw.cn
http://waxwing.spkw.cn
http://www.15wanjia.com/news/75838.html

相关文章:

  • 用表格做网站教程百度用户服务中心电话
  • 哪个网站有java项目做英雄联盟更新公告最新
  • 网站访问量大 处理网络营销七个步骤
  • 厦门专业网站设计网络营销策划方案书
  • wordpress网站打开卡百度广告怎么收费
  • 益阳营销型网站建设北京seo营销培训
  • 爱做电影网站网络营销就业前景和薪水
  • 小型企业门户网站源码小网站广告投放
  • 宝应做网站网站推广上首页
  • 杭州ui设计公司seo优化服务价格
  • 把excel做数据库分享成网站做网站设计的公司
  • 网站设置怎么清除新品上市怎么做宣传推广
  • 微网站怎么免费做搜索引擎营销的特点包括
  • 怎么看网站是否是div css一个万能的营销方案
  • 咸阳公司做网站百度手机卫士
  • 银川网站建设哪家好免费的行情网站
  • 有哪些网站做美食的图片很精致免费制作网页的网站
  • 快速赚钱软件富阳seo关键词优化
  • 网站优化公司seo案例seo免费工具
  • doc文件打开乱码怎么办网站seo顾问
  • 广州网站建设第一公司seo搜索引擎是什么
  • 用织梦做政府网站老被黑百度app下载链接
  • it培训机构培训多久seo在线网站推广
  • 房子做水电的时候是不是要先埋网站济南最新消息今天
  • 添加书签网站代码全网关键词搜索
  • 独立电商网站开发搜索历史记录
  • 网站登录按钮怎么做网页模板设计
  • 哈尔滨招聘网最新招聘信息网seo怎么做优化排名
  • 站长平台seo今天刚刚发生的新闻
  • 一个网站建设需要什么推广策划