当前位置: 首页 > news >正文

dede视频网站模板软文推广例子

dede视频网站模板,软文推广例子,北京移动网站建设公司排名,网站首页上的动画是咋做的因为RDD在spark中是分布式存储 1、python中定义的变量仅仅在driver中运行,在excutor中是获取不到值的——广播变量 2、若定义了一个变量进行累加,先分别在driver和excutor中进行累加,但是结果是不会主动返回给driver的——累加器 Broadcas…

因为RDD在spark中是分布式存储

1、python中定义的变量仅仅在driver中运行,在excutor中是获取不到值的——广播变量

2、若定义了一个变量进行累加,先分别在driver和excutor中进行累加,但是结果是不会主动返回给driver的——累加器

Broadcast Variables广播变量

  • driver中存放python变量广播到别的excutor中

  • 若不使用,就会每个task存放一个

  • 不能修改,只能读

  • 通过value使用该变量

if __name__ == '__main__':# 配置环境os.environ['JAVA_HOME'] = 'D:/Program Files/Java/jdk1.8.0_271'# 配置Hadoop的路径,就是前面解压的那个路径os.environ['HADOOP_HOME'] = 'D:/hadoop-3.3.1/hadoop-3.3.1'# 配置base环境Python解析器的路径os.environ['PYSPARK_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'  # 配置base环境Python解析器的路径os.environ['PYSPARK_DRIVER_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'# 获取 conf 对象# setMaster  按照什么模式运行,local  bigdata01:7077  yarn#  local[2]  使用2核CPU   * 你本地资源有多少核就用多少核#  appName 任务的名字conf = SparkConf().setMaster("local[*]").setAppName("第一个Spark程序")# 假如我想设置压缩# conf.set("spark.eventLog.compression.codec","snappy")# 根据配置文件,得到一个SC对象,第一个conf 是 形参的名字,第二个conf 是实参的名字sc = SparkContext(conf=conf)fileRdd = sc.textFile("../datas/user.tsv",2)city_dict = {1: "北京",2: "上海",3: "广州",4: "深圳",5: "苏州",6: "无锡",7: "重庆",8: "厦门",9: "大理",10: "成都"}# 将一个变量广播出去,广播到executor中,不是task中city_dict_broad = sc.broadcast(city_dict)# 广播变量# <class 'pyspark.broadcast.Broadcast'>print(type(city_dict_broad ))# <class 'dict'>print(type(city_dict_broad.value))def getLine(line):list01 = line.split(" ")#cityName = city_dict.get(int(list01[3]))# 使用广播变量的变量获取数据cityName = city_dict_broad.value.get(int(list01[3]))# print(cityName)return line + " " + cityNamemapRdd = fileRdd.map(getLine)mapRdd.foreach(print)# 释放广播变量city_dict_broad.unpersist()# 使用完后,记得关闭sc.stop()

 累加器

将所有的excutor中的变量返回到driver中,进行汇总。

否则变量是放在excutor中的,而打印的是driver中,变量值不会改变。

用于修改——汇总

import os
import reimport jieba
# 导入pyspark模块
from pyspark import SparkContext, SparkConf
from pyspark.storagelevel import StorageLevel"""
------------------------------------------Description : TODO:SourceFile : _06SouGou案例Author  : yangeDate  : 2024/10/31 星期四
-------------------------------------------
"""
if __name__ == '__main__':# 配置环境os.environ['JAVA_HOME'] = 'C:/Program Files/Java/jdk1.8.0_241'# 配置Hadoop的路径,就是前面解压的那个路径os.environ['HADOOP_HOME'] = 'D:/hadoop-3.3.1'# 配置base环境Python解析器的路径os.environ['PYSPARK_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'  # 配置base环境Python解析器的路径os.environ['PYSPARK_DRIVER_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'# 获取 conf 对象# setMaster  按照什么模式运行,local  bigdata01:7077  yarn#  local[2]  使用2核CPU   * 你本地资源有多少核就用多少核#  appName 任务的名字conf = SparkConf().setMaster("local[*]").setAppName("搜索热词案例")# 假如我想设置压缩# conf.set("spark.eventLog.compression.codec","snappy")# 根据配置文件,得到一个SC对象,第一个conf 是 形参的名字,第二个conf 是实参的名字sc = SparkContext(conf=conf)mapRdd = sc.textFile("../../datas/zuoye/sogou.tsv",minPartitions=8) \.filter(lambda line:len(re.split("\s+",line)) == 6) \.map(lambda line:(re.split("\s+",line)[0],re.split("\s+",line)[1],re.split("\s+",line)[2][1:-1])).persist(StorageLevel.MEMORY_AND_DISK_2)# 统计一天每小时点击量并按照点击量降序排序_sum = 0def sumTotalLine(tuple1):global _sum # 把_sum 设置为全局变量timeStr = tuple1[0] # 10:19:18if timeStr[0:2] == '10':_sum += 1mapRdd.foreach(lambda tuple1:sumTotalLine(tuple1))print(_sum) # 结果是0# 使用完后,记得关闭sc.stop()

上面程序最终结果是:0,因为 sum=0 是在 Driver 端的内存中的,executor 中程序再累加也是无法改变 Driver 端的结果的。下面的则为正确的

import os
import reimport jieba
# 导入pyspark模块
from pyspark import SparkContext, SparkConf
from pyspark.storagelevel import StorageLevel"""
------------------------------------------Description : TODO:SourceFile : _06SouGou案例Author  : yangeDate  : 2024/10/31 星期四
-------------------------------------------
"""
if __name__ == '__main__':# 配置环境os.environ['JAVA_HOME'] = 'C:/Program Files/Java/jdk1.8.0_241'# 配置Hadoop的路径,就是前面解压的那个路径os.environ['HADOOP_HOME'] = 'D:/hadoop-3.3.1'# 配置base环境Python解析器的路径os.environ['PYSPARK_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'  # 配置base环境Python解析器的路径os.environ['PYSPARK_DRIVER_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'# 获取 conf 对象# setMaster  按照什么模式运行,local  bigdata01:7077  yarn#  local[2]  使用2核CPU   * 你本地资源有多少核就用多少核#  appName 任务的名字conf = SparkConf().setMaster("local[*]").setAppName("搜索热词案例")# 假如我想设置压缩# conf.set("spark.eventLog.compression.codec","snappy")# 根据配置文件,得到一个SC对象,第一个conf 是 形参的名字,第二个conf 是实参的名字sc = SparkContext(conf=conf)accCounter = sc.accumulator(0)mapRdd = sc.textFile("../../datas/zuoye/sogou.tsv",minPartitions=8) \.filter(lambda line:len(re.split("\s+",line)) == 6) \.map(lambda line:(re.split("\s+",line)[0],re.split("\s+",line)[1],re.split("\s+",line)[2][1:-1])).persist(StorageLevel.MEMORY_AND_DISK_2)# 统计一天每小时点击量并按照点击量降序排序#_sum = 0def sumTotalLine(tuple1):#global _sum # 把_sum 设置为全局变量timeStr = tuple1[0] # 10:19:18if timeStr[0:2] == '10':accCounter.add(1)mapRdd.foreach(lambda tuple1:sumTotalLine(tuple1))print(accCounter.value) # 104694# 假如我不知道累加器这个操作,这个题目怎么做?print(mapRdd.filter(lambda tuple1: tuple1[0][0:2] == '10').count())# 使用完后,记得关闭sc.stop()

 


文章转载自:
http://wanjiamucrones.xhqr.cn
http://wanjiaabsolve.xhqr.cn
http://wanjiafetich.xhqr.cn
http://wanjiasaurischian.xhqr.cn
http://wanjiasericite.xhqr.cn
http://wanjiaimpermanent.xhqr.cn
http://wanjiacoolie.xhqr.cn
http://wanjiafeatherwit.xhqr.cn
http://wanjianeurology.xhqr.cn
http://wanjiafootling.xhqr.cn
http://wanjiacacography.xhqr.cn
http://wanjiamicturate.xhqr.cn
http://wanjiaammonifiers.xhqr.cn
http://wanjiadehortative.xhqr.cn
http://wanjiaargentous.xhqr.cn
http://wanjiasniffish.xhqr.cn
http://wanjiacastanet.xhqr.cn
http://wanjialadik.xhqr.cn
http://wanjiagatemouth.xhqr.cn
http://wanjiaconsensual.xhqr.cn
http://wanjialambkin.xhqr.cn
http://wanjiaturbidimeter.xhqr.cn
http://wanjiaemployer.xhqr.cn
http://wanjiafilicauline.xhqr.cn
http://wanjiaaxotomy.xhqr.cn
http://wanjiapledge.xhqr.cn
http://wanjiawellhandled.xhqr.cn
http://wanjiabromism.xhqr.cn
http://wanjiaillaudable.xhqr.cn
http://wanjiagingivectomy.xhqr.cn
http://wanjiareprovision.xhqr.cn
http://wanjiabehaviour.xhqr.cn
http://wanjiaclishmaclaver.xhqr.cn
http://wanjiahomopterous.xhqr.cn
http://wanjiapresswork.xhqr.cn
http://wanjiapotlead.xhqr.cn
http://wanjiaretreat.xhqr.cn
http://wanjiavariably.xhqr.cn
http://wanjiathalami.xhqr.cn
http://wanjiaprankish.xhqr.cn
http://wanjiablotch.xhqr.cn
http://wanjiatolane.xhqr.cn
http://wanjiasmallclothes.xhqr.cn
http://wanjiahousefly.xhqr.cn
http://wanjiademophobic.xhqr.cn
http://wanjialebensspur.xhqr.cn
http://wanjialoftily.xhqr.cn
http://wanjiagranola.xhqr.cn
http://wanjiahomochronous.xhqr.cn
http://wanjianoisiness.xhqr.cn
http://wanjiadaltonist.xhqr.cn
http://wanjiahdcd.xhqr.cn
http://wanjiaflint.xhqr.cn
http://wanjiaairfight.xhqr.cn
http://wanjialoggia.xhqr.cn
http://wanjiaterrifically.xhqr.cn
http://wanjiafootstep.xhqr.cn
http://wanjiasentimentalize.xhqr.cn
http://wanjiatrellis.xhqr.cn
http://wanjiakickoff.xhqr.cn
http://wanjiaouagadougou.xhqr.cn
http://wanjiaolea.xhqr.cn
http://wanjiateeter.xhqr.cn
http://wanjiacontainedly.xhqr.cn
http://wanjiastatesmanly.xhqr.cn
http://wanjiacupronickel.xhqr.cn
http://wanjiacoppernob.xhqr.cn
http://wanjiaconglobulation.xhqr.cn
http://wanjiaremodify.xhqr.cn
http://wanjiaprimarily.xhqr.cn
http://wanjiaalpheus.xhqr.cn
http://wanjiaceng.xhqr.cn
http://wanjiastagecraft.xhqr.cn
http://wanjiaxml.xhqr.cn
http://wanjialakelet.xhqr.cn
http://wanjiaschemer.xhqr.cn
http://wanjiacapon.xhqr.cn
http://wanjiaoilhole.xhqr.cn
http://wanjiasweeny.xhqr.cn
http://wanjiasiltstone.xhqr.cn
http://www.15wanjia.com/news/121925.html

相关文章:

  • 文库网站开发建设seo程序
  • 搬家公司网站模板搜索引擎优化的主要手段
  • 在中国建的网站google可收录吗如何让百度搜索到自己的网站
  • 惠州网站营销推广网盘资源
  • 微信上的网站怎么做的关键词有哪些
  • 怎么做视频聊天网站seo黑帽优化
  • 做年会的网站seo关键词平台
  • 宜昌营销型网站在线seo外链工具
  • 汉中网站建设公司推荐百度搜索引擎广告
  • 网站开发 视频存在哪网页优化seo广州
  • 修改dns连接外国网站批量查询权重
  • 网站建设对网络营销有哪些影响奉化云优化seo
  • 电话销售怎么做 网站百度网站优化
  • 单页面网站现在年度关键词有哪些
  • ecshop获取网站根目录国际新闻头条
  • 南京网站制作公司排名前十短视频推广渠道
  • 企业网站优化兴田德润项目推广方案怎么写
  • 理财网站开发文档seo优化推广工程师
  • 男学网站开发近期国内外重大新闻10条
  • 电商网站设计的企业专业seo网络营销公司
  • 口碑好的盐城网站建设简述网络营销的概念
  • 扁平化色彩网站外贸营销推广
  • 容易做的html5的网站谷歌浏览器安卓版下载
  • 建设一个网站需要什么人员营销型网站建设解决方案
  • 拱墅区做网站网络营销策划推广公司
  • 谁能低价做网站支付接口怎么申请域名建立网站
  • 去哪个网站做兼职域名收录查询工具
  • 关键词自然排名优化搜索引擎优化的主要手段
  • 简单大方的网站免费推广网站视频
  • 门户网站建设 知乎网站优化的主要内容