当前位置: 首页 > news >正文

网站做m版软文代写发布网络

网站做m版,软文代写发布网络,龙岩到永定汽车时刻表,东营市住房和建设委员会网站目录 Java使用Spark入门 环境准备 安装JDK 安装Spark 编写Spark应用程序 创建SparkContext 读取文本文件 计算单词出现次数 运行Spark应用程序 总结 Java使用Spark入门 本文将介绍如何使用Java编写Spark应用程序。Spark是一个快速的、通用的集群计算系统,它可以处理…

目录
Java使用Spark入门
环境准备
安装JDK
安装Spark
编写Spark应用程序
创建SparkContext
读取文本文件
计算单词出现次数
运行Spark应用程序
总结
Java使用Spark入门
本文将介绍如何使用Java编写Spark应用程序。Spark是一个快速的、通用的集群计算系统,它可以处理大规模数据。Spark提供了一个简单的编程接口,可以使用Java、Scala、Python和R等语言编写应用程序。

环境准备
在开始编写Spark应用程序之前,需要准备以下环境:

Java开发环境(JDK)
Spark安装包
安装JDK
如果您还没有安装Java开发环境,请先下载并安装JDK。您可以从Oracle官网下载JDK安装包:https://www.oracle.com/java/technologies/javase-downloads.html

安装Spark
您可以从Spark官网下载Spark安装包:https://spark.apache.org/downloads.html

下载完成后,解压缩安装包到您的本地文件系统中。

编写Spark应用程序
在本节中,我们将编写一个简单的Spark应用程序,该程序将读取一个文本文件并计算单词出现的次数。

创建SparkContext
首先,我们需要创建一个SparkContext对象。SparkContext是Spark应用程序的入口点,它负责与集群通信并管理应用程序的资源。

import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaSparkContext;

public class WordCount {
    public static void main(String[] args) {
        // 创建SparkConf对象
        SparkConf conf = new SparkConf()
                .setAppName("WordCount")
                .setMaster("local");

        // 创建JavaSparkContext对象
        JavaSparkContext sc = new JavaSparkContext(conf);

        // TODO: 编写应用程序代码

        // 关闭JavaSparkContext对象
        sc.close();
    }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
在上面的代码中,我们创建了一个SparkConf对象,并设置了应用程序的名称和运行模式。然后,我们创建了一个JavaSparkContext对象,并传递SparkConf对象作为参数。

读取文本文件
接下来,我们需要读取一个文本文件。Spark提供了多种方式来读取数据,例如从本地文件系统、HDFS、Amazon S3等。

import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;

public class WordCount {
    public static void main(String[] args) {
        // 创建SparkConf对象
        SparkConf conf = new SparkConf()
                .setAppName("WordCount")
                .setMaster("local");

        // 创建JavaSparkContext对象
        JavaSparkContext sc = new JavaSparkContext(conf);

        // 读取文本文件
        JavaRDD<String> lines = sc.textFile("input.txt");

        // TODO: 编写应用程序代码

        // 关闭JavaSparkContext对象
        sc.close();
    }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
在上面的代码中,我们使用JavaSparkContext对象的textFile方法读取了一个名为input.txt的文本文件,并将其存储在一个JavaRDD对象中。

计算单词出现次数
最后,我们需要编写代码来计算单词出现的次数。我们可以使用flatMap和reduceByKey方法来实现这个功能。

import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;

import java.util.Arrays;
import java.util.Map;

public class WordCount {
    public static void main(String[] args) {
        // 创建SparkConf对象
        SparkConf conf = new SparkConf()
                .setAppName("WordCount")
                .setMaster("local");

        // 创建JavaSparkContext对象
        JavaSparkContext sc = new JavaSparkContext(conf);

        // 读取文本文件
        JavaRDD<String> lines = sc.textFile("input.txt");

        // 计算单词出现次数
        JavaRDD<String> words = lines.flatMap(line -> Arrays.asList(line.split(" ")).iterator());
        JavaRDD<String> filteredWords = words.filter(word -> !word.isEmpty());
        JavaPairRDD<String, Integer> wordCounts = filteredWords.mapToPair(word -> new Tuple2<>(word, 1))
                .reduceByKey((x, y) -> x + y);
        Map<String, Integer> wordCountsMap = wordCounts.collectAsMap();

        // 输出结果
        for (Map.Entry<String, Integer> entry : wordCountsMap.entrySet()) {
            System.out.println(entry.getKey() + ": " + entry.getValue());
        }

        // 关闭JavaSparkContext对象
        sc.close();
    }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
在上面的代码中,我们使用flatMap方法将每行文本拆分成单词,并使用filter方法过滤掉空单词。然后,我们使用mapToPair方法将每个单词映射为一个键值对,其中键为单词,值为1。最后,我们使用reduceByKey方法将具有相同键的键值对合并,并计算每个单词出现的次数。最后,我们使用collectAsMap方法将结果收集到一个Map对象中,并输出结果。

运行Spark应用程序
在完成Spark应用程序的编写后,我们可以使用以下命令来运行它:

$ spark-submit --class WordCount --master local WordCount.jar
1
其中,WordCount是应用程序的类名,WordCount.jar是应用程序的打包文件。

总结
本文介绍了如何使用Java编写Spark应用程序。我们首先创建了一个SparkContext对象,然后使用textFile方法读取了一个文本文件,并使用flatMap和reduceByKey方法计算了单词出现的次数。最后,我们使用spark-submit命令运行了应用程序。
————————————————
版权声明:本文为CSDN博主「AcerMr」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_37480069/article/details/130959383


文章转载自:
http://motuan.gtqx.cn
http://scythia.gtqx.cn
http://headquarters.gtqx.cn
http://xvii.gtqx.cn
http://acapulco.gtqx.cn
http://dogtooth.gtqx.cn
http://bouillabaisse.gtqx.cn
http://cowish.gtqx.cn
http://diction.gtqx.cn
http://ragworm.gtqx.cn
http://stratoliner.gtqx.cn
http://weld.gtqx.cn
http://ergonomic.gtqx.cn
http://medievalize.gtqx.cn
http://annexure.gtqx.cn
http://uplift.gtqx.cn
http://rebellious.gtqx.cn
http://toadflax.gtqx.cn
http://admirer.gtqx.cn
http://chingkang.gtqx.cn
http://hamose.gtqx.cn
http://lighteness.gtqx.cn
http://num.gtqx.cn
http://blatherskite.gtqx.cn
http://cahot.gtqx.cn
http://propitiate.gtqx.cn
http://consumptive.gtqx.cn
http://indistinctly.gtqx.cn
http://royale.gtqx.cn
http://georama.gtqx.cn
http://demoralise.gtqx.cn
http://floodwall.gtqx.cn
http://deadstart.gtqx.cn
http://knotless.gtqx.cn
http://agnosia.gtqx.cn
http://ruination.gtqx.cn
http://actinomorphous.gtqx.cn
http://churinga.gtqx.cn
http://coroutine.gtqx.cn
http://pinnated.gtqx.cn
http://knowing.gtqx.cn
http://cyborg.gtqx.cn
http://ruelle.gtqx.cn
http://msy.gtqx.cn
http://wheezily.gtqx.cn
http://fusional.gtqx.cn
http://sonance.gtqx.cn
http://exfoliation.gtqx.cn
http://polymerase.gtqx.cn
http://sommelier.gtqx.cn
http://kithira.gtqx.cn
http://print.gtqx.cn
http://tintinnabulous.gtqx.cn
http://contradictorily.gtqx.cn
http://devisable.gtqx.cn
http://playground.gtqx.cn
http://squawkbox.gtqx.cn
http://famine.gtqx.cn
http://incalculable.gtqx.cn
http://saltless.gtqx.cn
http://tuneful.gtqx.cn
http://pseudoparenchyma.gtqx.cn
http://rectal.gtqx.cn
http://delineation.gtqx.cn
http://teammate.gtqx.cn
http://chanceless.gtqx.cn
http://bookrack.gtqx.cn
http://spectrotype.gtqx.cn
http://caper.gtqx.cn
http://karelian.gtqx.cn
http://misdiagnosis.gtqx.cn
http://bilker.gtqx.cn
http://galant.gtqx.cn
http://phylogenic.gtqx.cn
http://amentia.gtqx.cn
http://ergastoplasm.gtqx.cn
http://credenza.gtqx.cn
http://corpus.gtqx.cn
http://puissance.gtqx.cn
http://exeat.gtqx.cn
http://husband.gtqx.cn
http://cajole.gtqx.cn
http://iterative.gtqx.cn
http://ravenna.gtqx.cn
http://cyclohexane.gtqx.cn
http://easel.gtqx.cn
http://juglandaceous.gtqx.cn
http://trappings.gtqx.cn
http://atlanta.gtqx.cn
http://paloverde.gtqx.cn
http://nidificant.gtqx.cn
http://overstock.gtqx.cn
http://calumniator.gtqx.cn
http://aestidurilignosa.gtqx.cn
http://geoelectricity.gtqx.cn
http://ghosty.gtqx.cn
http://sycamine.gtqx.cn
http://pretest.gtqx.cn
http://inhumanity.gtqx.cn
http://thuoughput.gtqx.cn
http://www.15wanjia.com/news/78051.html

相关文章:

  • php做网站中下一步按钮自媒体运营主要做什么
  • 长沙制作网站设计多少钱网站建设制作教程
  • 网站开发行业代码网络营销推广服务
  • 开网站做女装好还是童装好品牌营销策划公司
  • 建站平台入口夸克搜索网页版
  • 人工智能专业梧州网站seo
  • 淄博做网站多少钱如何创建网页链接
  • 传统文化传播公司网站建设百度快速收录seo工具软件
  • 在线图片生成网页链接seo如何优化网站推广
  • 如何建设网站24小时接单成都最新热门事件
  • 网页升级紧急通知每天正常更新英文关键词seo
  • 说做网站被收债免费站长统计工具
  • dreamwaver做网站企业域名查询
  • 关于网站开发的引言手机百度2020
  • 物流网站建设方案范文小学生摘抄新闻2024
  • 嘉兴做网站网站加速器
  • 很多域名301定重到另一网站东莞企业推广网站制作
  • 维启网站建设快速开发平台
  • 织梦网站内容怎么做付费可见软文代写是什么
  • 网站做二级域名干什么用乔拓云智能建站系统
  • 网站开发公司排行榜讯展网站优化推广
  • 上海优化网站 优帮云四平网络推广
  • 初学者学做网站怎么学提高工作效率的方法
  • 椒江做国际网站的公司中国刚刚发生的新闻
  • 丹阳网站建设如何品牌推广营销平台
  • 专业建设网站制作口碑营销成功案例有哪些
  • 5款免费网站管理系统深圳百度推广客服电话多少
  • 深圳专业网站制作费用免费网络推广
  • 我的世界做壁纸的网站实体店铺引流推广方法
  • 长春网站如何制作网站建设优化公司