当前位置: 首页 > news >正文

中卫企业管理培训网站环保网页设计

中卫企业管理培训网站,环保网页设计,xampp wordpress教程,求一个网站你知道的简介 注意: 在部署spark集群前,请部署好Hadoop集群,jdk8【当然Hadoop集群需要运行在jdk上】,需要注意hadoop,spark的版本,考虑兼容问题。比如hadoop3.0以上的才兼容spark3.0以上的。 下面是Hadoop集群部署…

简介

 

注意:

在部署spark集群前,请部署好Hadoop集群,jdk8【当然Hadoop集群需要运行在jdk上】,需要注意hadoop,spark的版本,考虑兼容问题。比如hadoop3.0以上的才兼容spark3.0以上的。

下面是Hadoop集群部署的链接,个人笔记,已经成功部署两次了,实时更新,分【一】【二】两部分,需要的自己看。不懂欢迎问,看到了解答。(链接失效的话请参考个人主页)

hadoop集群部署【一】HDFS集群icon-default.png?t=N7T8http://t.csdnimg.cn/BVKlqhadoop集群部署【二】YARN,MapReduce集群icon-default.png?t=N7T8http://t.csdnimg.cn/aJJt7

 搭建准备工作:

需要python环境,上传Anaconda,找到放置的位置。

安装Anaconda

在node1(我的第一台机器名)安装Anaconda(我的是Anaconda3-2021.05-Linux-x86_64.sh         版本python3.8)

sh ./Anaconda3-2021.05-Linux-x86_64.sh

然后一直空格,出现[yes|no] 就回答yes,懂?

出现这样的就填你要把anaconda安装到哪里。(路径)

完成后结果(退出终端,重新进来)

更改conda国内源

vim ~/.condarc(新建的,一般里面没东西)

channels:- defaults
show_channel_urls: true
default_channels:- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloudmsys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloudbioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloudmenpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloudpytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloudsimpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud

终端输入 

python

 创建spark运行的虚拟环境

conda create -n pyspark python=3.8
 切换虚拟环境
conda activate pyspark

 

Spark Local部署

上传解压spark

(我的是 spark-3.2.0-bin-hadoop3.2.tgz)

通过什么工具不管,能上传就行。

找到spark上传的位置,cd 进到该目录,不进去也行,自己在前面加路径哈!解压。

 tar -zxvf spark-3.2.0-bin-hadoop3.2.tgz -C /export/server spark-3.2.0-bin-hadoop3.2/

-C 参数后跟解压到哪(路径)

cd /export/server    #填你自己解压的路径

 建立软链接

 ln -s spark-3.2.0-bin-hadoop3.2/ spark
ll

 配置环境变量

vim /etc/profile

export SPARK_HOME=/export/server/spark
export PYSPARK_PYTHON=/export/server/anaconda3/envs/pyspark/bin/python3.8
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
:wq
source /etc/profile
vim /root/.bashrc

添加 

export JAVA_HOME=/export/server/jdk
export PYSPARK_PYTHON=/export/server/anaconda3/envs/pyspark/bin/python3.8
:wq

启动spark local模式

pyspark

进入spark的bin路径下

cd /export/server/spark/bin  # 注意路径
./pyspark

 运行下面代码,结果参考上图

sc.parallelize([1,2,3,4,5]).map(lambda x:x *10).collect()

可以通过游览器输入node1:4040查看监控页面(多个进程不会起冲突,具体监控页面的端口看上图spark版本下面第二行)

Ctrl+d退出

scala交互式界面
./spark-shell

 Ctrl+d退出

提交python文件(参考spark自带的案例文件pi.py    求圆周率,参数10 迭代十次)
./spark-submit --master local[*] /export/server/spark/examples/src/main/python/pi.py 10

 提交文件没有监控界面

http://www.15wanjia.com/news/181502.html

相关文章:

  • 运城网站建设维护wordpress 移动端网页
  • 用户注册网站开发爱做片视频网站
  • 网站建设教程赚找湖南岚鸿认 可商品门户网站解决方案
  • 沈阳网站制作费用淘宝网站是谁做的
  • 龙岩网站推广营销泰安网站开发公司
  • 外贸商城网站建站怎样做好营销推广
  • 大气黑色女性时尚类网站织梦模板wordpress 列表插件
  • 网站建设目的及意义郴州市建设局网站节能科
  • 济南网站建设公司选济南网络福州seo公司网站
  • 网站如何备份未成年人思想道德建设网站
  • 网站注册流程和费用html5网站动态效果
  • 深圳网络营销的公司哪家好天津百度推广优化排名
  • 网站的主题是什么免费做调查问卷的网站
  • 十大排行装修公司seo点击优化
  • 做微信表情的微信官方网站深圳集团网站建设
  • 网站开发的标准python如何安装wordpress
  • 那些做电影的网站赚钱吗合肥个人建站模板
  • 做衣服的网站推荐找做网站
  • 成都高端网站建设高大上的公司网站
  • 网站名和域名的区别泰安高新区建设局网站
  • 专业做网站公司哪家好中建材建设有限公司网站
  • 视频网站制作教程视频wordpress制作网页
  • 郑州网站建设君捷品牌网站制作
  • 科威网络做网站怎么样软文撰写
  • 做株洲网站需要多少钱地理位置地图网站建设
  • 上海临平路网站建设新乡做网站费用
  • 深圳网站优化费用网站推荐几个
  • 南昌网站改版公司广州网站建设信息科技有限公司
  • 二手汽车手机网站模板宜兴建设局 审图中心 网站
  • 东莞做网站那家好iis网站属性没有asp.net