2023_Spark_实验三:基于IDEA开发Scala例子

31 篇文章 4 订阅
订阅专栏
16 篇文章 1 订阅
订阅专栏
6 篇文章 0 订阅
订阅专栏

一、创建一个空项目,作为整个项目的基本框架

二、创建SparkStudy模块,用于学习基本的Spark基础

三、创建项目结构

1、在SparkStudy模块下的pom.xml文件中加入对应的依赖,并等待依赖包下载完毕。

在pom.xml文件中加入对应的依赖

​

<!-- Spark及Scala的版本号 -->

<properties>

<scala.version>2.11</scala.version>

<spark.version>2.1.1</spark.version>

</properties>

<!-- Mysql组件

<dependency>

<groupId>mysql</groupId>

<artifactId>mysql-connector-java</artifactId>

<version>5.7.22.1</version>

</dependency> 的依赖 -->

<!-- Spark各个组件的依赖 -->

<dependencies>

<!-- https://mvnrepository.com/artifact/com.thoughtworks.paranamer/paranamer -->

<dependency>

<groupId>com.thoughtworks.paranamer</groupId>

<artifactId>paranamer</artifactId>

<version>2.8</version>

</dependency>

<dependency>

<groupId>org.apache.spark</groupId>

<artifactId>spark-core_${scala.version}</artifactId>

<version>${spark.version}</version>

</dependency>

<dependency>

<groupId>org.apache.spark</groupId>

<artifactId>spark-sql_${scala.version}</artifactId>

<version>${spark.version}</version>

</dependency>

<dependency>

<groupId>org.apache.spark</groupId>

<artifactId>spark-streaming_2.11</artifactId>

<version>${spark.version}</version>

</dependency>

<dependency>

<groupId>org.apache.spark</groupId>

<artifactId>spark-mllib_2.11</artifactId>

<version>2.1.1</version>

</dependency>

<dependency>

<groupId>org.apache.spark</groupId>

<artifactId>spark-streaming-kafka-0-10_2.11</artifactId>

<version>2.3.0</version>

</dependency>

<dependency>

<groupId>org.apache.spark</groupId>

<artifactId>spark-streaming-kafka-0-8_${scala.version}</artifactId>

<version>2.3.0</version>

</dependency>

<dependency>

<groupId>net.jpountz.lz4</groupId>

<artifactId>lz4</artifactId>

<version>1.3.0</version>

</dependency>

<dependency>

<groupId>mysql</groupId>

<artifactId>mysql-connector-java</artifactId>

<version>8.0.18</version>

</dependency>

<dependency>

<groupId>org.apache.flume.flume-ng-clients</groupId>

<artifactId>flume-ng-log4jappender</artifactId>

<version>1.7.0</version>

</dependency>

<!-- <dependency>-->

<!-- <groupId>org.apache.spark</groupId>-->

<!-- <artifactId>spark-streaming-flume-sink_2.10</artifactId>-->

<!-- <version>1.5.2</version>-->

<!-- </dependency>-->

<dependency>

<groupId>org.apache.spark</groupId>

<artifactId>spark-hive_2.12</artifactId>

<version>2.4.8</version>

</dependency>

</dependencies>

<!-- 配置maven打包插件及打包类型 -->

<build>

<plugins>

<plugin>

<groupId>org.apache.maven.plugins</groupId>

<artifactId>maven-compiler-plugin</artifactId>

<version>3.8.1</version>

<configuration>

<source>1.8</source>

<target>1.8</target>

</configuration>

</plugin>

<plugin>

<groupId>org.apache.maven.plugins</groupId>

<artifactId>maven-assembly-plugin</artifactId>

<configuration>

<descriptorRefs>

<descriptorRef>jar-with-dependencies</descriptorRef>

</descriptorRefs>

</configuration>

</plugin>

</plugins>

</build>


​

等待依赖包下载完毕

2、若不能自动下载依赖包,则按以下步骤操作

四、创建SCALA目录

四、解决无法创建scala文件问题

验证:

问题解决!

五、编写第一个SCALA程序

成功!

基于IntelliJ IdeaScala开发demo一Spark-SQL开发demo
心相印的专栏
11-14 1214
真正在做数据分析和数据处理的时候,spark-sql还是用得比较的,本文主要给出基于Scalaspark-sql开发demo,本文已经假设IntelliJ Idea上的Scala开发环境,包括SBT已经安装配置完成,如果读者还没有这些准备的话,可以参考我前面的关于IntelliJ IdeaScalaspark开发环境搭建相关文章。
Scala案例详解
Dream_aju的博客
10-12 486
1.编写一个方法,getValues(arrLArray[Int],v:Int)返回数组中 小于v,等于v,大于v的元素个数,要求三个值一起返回 object _01WorkGetValues { def main(args: Array[String]): Unit = { //定义一个数组 val arr:Array[Int] = Array(1,3,4,6,7,4,7,8,9,3) //v=6 计算大于6 小于6 等于6 val temp = getCount.
Spark Scala大数据编程实例
qq_54078788的博客
03-20 2314
初步介绍scala,下载安装配置sparkscala,运行spark scala版本实例
ScalaSpark大数据处理的完美组合
最新发布
2401_85639015的博客
08-07 1222
函数式编程:支持高阶函数、不可变数据结构等。面向对象编程:支持类和对象的定义,并具备继承、多态等特性。与Java兼容:可以与Java代码互操作,方便使用现有的Java库。表达能力强:代码简洁,能够用更少的代码实现更多功能。Apache Spark是一个开源的分布式计算框架,用于处理大规模数据集。内存计算:通过将数据存储在内存中,显著提升计算速度。RDD(弹性分布式数据集):提供了一个可以并行处理的数据结构。支持多种编程语言:包括Java、Python、Scala和R。丰富的库支持。
Scala开发Example
haha_mingg的专栏
08-15 690
Scala例 子:   HelloScala.scala: object links extends Application {        print("heelo");        println();        def factorial(x:BigIn
Scala面向对象部分演示(IDEA开发
qq_58476985的博客
11-03 530
3.private[this]的方法:该属性只属于该对象私有,就不会生成对应的set和get方法。Scala的包和Java中的包或者C++中的命名空间的目的是相同的:管理大型程序中的名称。当定义属性是private时候,scala会自动为其生成对应的get和set方法,如下所。你必须在同一个源文件里定义类和它的伴生对象。如果要开发main方法,需要将main方法定义在该类的伴生对象中,即:object对。Scala 中使用单例模式时,除了定义的类之外,还要定义一个同名的 object 对。
Spark:用Scala和Java实现WordCount
03-03
Scala和Java实现WordCount,其中Java实现的JavaWordCount是spark自带的例子($SPARK_HOME/examples/src/main/java/org/apache/spark/examples/JavaWordCount.java)OS:RedHatEnterpriseLinuxServerrelease6.4...
Spark大数据分析与实战:基于Spark MLlib 实现音乐推荐
?
06-26 1万+
Spark大数据分析与实战:基于Spark MLlib 实现音乐推荐 基于Spark MLlib 实现音乐推荐 一、实验背景: 熟悉 Audioscrobbler 数据集 基于该数据集选择合适的 MLlib 库算法进行数据处理 进行音乐推荐(或用户推荐) 二、实验目的: 计算AUC评分最高的参数 利用AUC评分最高的参数,给用户推荐艺术家 对多个用户进行艺术家推荐 利用AUC评分最高的参数,给艺术家推荐喜欢他的用户 三、实验步骤: 安装Hadoop和Spark 启动Hadoop与Spark 将文件上传到
基于IntelliJ IDEA开发Spark的Maven项目——Scala语言
热门推荐
Ganymede的Hadoop世界
07-05 3万+
基于IntelliJ IDEA开发Spark的Maven项目——Scala语言 Maven管理项目在JavaEE普遍使用,开发Spark项目也不例外,而Scala语言开发Spark项目的首选。因此需要构建Maven-Scala项目来开发Spark项目,本文采用的工具是IntelliJ IDEA 2016,IDEA工具越来越被大家认可,开发java, python ,scala 支持都非常好
IDEA开发scala
自渡
05-07 1733
1、准备环境 文件→设置→Plugins→搜索SCALA→点击search in repositories→选择language的scala→install 需要重启IDEA来激活SCALA插件 2、开发 一、 二、选择maven,点击下一个 点击完成 三、 用maven开发需要手动添加scala框架 选择添加框架的支持 勾上scala,点击确定 ...
idea中实体类右击没有ptg_IDEA maven项目中新建.scala文件
weixin_39612220的博客
11-20 323
本文首发于我的博客[IDEA maven项目中新建.scala文件]分为三步第一步、IDEA中安装scala插件1、搜索安装File-Sittings-Plugins-搜索安装scala2、安装完成重启安装完成之后点击重启idea第二步、下载、安装、配置Scala1、下载安装Scala SDK本体搜索引擎搜索Scala SDK或者点我去Scala官方下载页面往下翻,找到这里,选择对应的操作系统下载...
spark-scala-maven实例
09-03
基于sparkscala maven实例项目两个简单的统计实例,适合初学者了解。 /** * 第一步:创建Spark的配置对象SparkConf,设置Spark程序的运行时的配置信息, * 例如说通过setMaster来设置程序要链接的Spark集群的Master的URL,如果设置为 * local,则代表Spark程序在在本地运行 */
hadoop scala spark 例子项目,运行了单机wordcount
07-28
hadoop scala spark 例子项目,运行了单机wordcount
scala 案例
09-14
scala 案例
scala例子 实例
01-04
scala例子 scala例子 scala例子 scala例子 scala例子 scala例子
如何使用IDEA工具开发Scala程序?
黑马程序员官方博客
02-23 2604
如何使用IDEA工具开发Scala程序,具体步骤如下。 (1)创建工程。在 IDEA工具主界面中单击【Create New Project】创建工程,效果如图1所示。 图1 创建Scala工程 在图1中可以看出,选择“Scala”,然后选中“IDEA开发工具,再单击【Next】按钮,效果如图2所示。 图2 配置Scala工程 从图2中看出,已经配置好Scala工程,然后单击【Finish】按钮,则Scala工程已经创建完成,效果如图3所示。 图3 Scala工程创建完成 在图3中
IntelliJ IDEA 中用scala编程
Doryh1010的博客
03-14 1881
目录二. 测试Scala插件 九九乘法表三.spark环境的配置
(五)scalaspark开发实例(sparkStreaming+sparkSql)
weixin_43930865的博客
10-03 917
spark开发实例 1:开发准备 java,hadoop,scala,maven的windows环境都已配置并验证完毕 2:spark的wordcount代码详解 先把集群的hdfs-site,xml,core-site.xml都放到resources下面 原始数据:data1.txt 1 Java bigdata 2 Java bigdata /** * 在Spark中,所有的编程入口都是...
spark scala 小程序发布示例
ocean42234111的博客
05-22 893
--项目codepackage stubsimport org.apache.spark.SparkContextobject CountJPGs {   def main(args: Array[String]) {     if (args.length &lt; 1) {       System.err.println("Usage: solution.CountJPGs &lt;logf...
写文章

热门文章

  • 2023_Spark_实验三:基于IDEA开发Scala例子 6895
  • 2023_Spark_实验一:Windows中基础环境安装 4992
  • VMware虚拟机安装及静态IP设置配置国内镜像 4772
  • 2023_Spark_实验二:IDEA安装及配置 4439
  • 【Hadoop全分布式环境搭建】 4284

分类专栏

  • Spark实验 31篇
  • Spark 10篇
  • Scala 16篇
  • MindSpore实践 21篇
  • MindSpore 25篇
  • 可视化大屏 18篇
  • 容器 1篇
  • 工具使用 1篇
  • IDEA 6篇
  • Linux 10篇
  • flume 2篇
  • Java 4篇
  • windows 1篇
  • WMware 1篇
  • Centos7 3篇
  • RedHat 1篇
  • Hadoop 15篇
  • MySQL 2篇
  • 数仓 1篇
  • SQL 3篇

最新评论

  • 基于Scala开发Spark ML的ALS推荐模型实战

    pblh123: 在 Spark 的机器学习中,如果某个用户的评分数据全部被划分到了测试集,在对这个用户进行推荐(transform)时,确实有可能出现 NaN 的情况。 原因是当进行推荐计算时,如果没有该用户在训练集中的数据,模型可能无法准确预测该用户的偏好,从而导致结果出现缺失值(NaN)。 为了避免这种情况,可以考虑以下方法: 1. 调整数据集划分策略,确保每个用户的部分数据在训练集中,以便模型能够学习到该用户的一些特征。 2. 使用更合适的推荐算法,一些算法可能对数据缺失有更好的处理方式。

  • 基于Scala开发Spark ML的ALS推荐模型实战

    Ocean_Hai22: 我有个问题想请教,如果划分数据集时,某个用户的评分数据全部都被划分到了测试集,当对这个用户进行推荐时(即transform那里),你这里不会得到NaN吗?

  • 昇思25天学习打卡营第9天|MindSpore-Vision Transformer图像分类

    CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单,全部的排名请看 https://bbs.csdn.net/topics/619124193。

  • 【可视化大屏开发】15.可视化大屏项目-网络访问静态数据无法更新问题修复

    pblh123: 拼写检查错误有没有

  • 【可视化大屏开发】15.可视化大屏项目-网络访问静态数据无法更新问题修复

    过堂风QAQ: applicant.property也配置了,显示的No usages found in Project Files。

最新文章

  • 2023_Spark_实验十一:RDD基础算子操作
  • 2023_Spark_实验十:Centos_Spark Local模式部署
  • 2023_Spark_实验九:编写WordCount程序(Scala版)
2024
09月 5篇
07月 18篇
06月 7篇
04月 7篇
03月 3篇
2023年57篇
2022年18篇
2021年3篇

目录

目录

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家佛山动物玻璃钢雕塑校园玻璃钢卡通雕塑商家广东通道商场美陈市场蚌埠人物玻璃钢雕塑定做价格商场周边亮化美陈玻璃钢卡通公仔雕塑厂家江苏常用商场美陈销售扬州商场节庆美陈美陈玻璃钢人物雕塑包括哪些不锈钢水景玻璃钢景观雕塑定制四川玻璃钢仿砂岩雕塑装饰商场美陈多少钱道路景观玻璃钢花盆遂宁玻璃钢雕塑制作厂家东营玻璃钢人物雕塑定制价格海南玻璃钢雕塑方案茂名市玻璃钢雕塑营业执照商场六一美陈图片禹州玻璃钢花盆花器商场美陈折纸效果图闵行区镜面玻璃钢雕塑询问报价黑龙江个性化玻璃钢雕塑定做价格衡阳玻璃钢座椅雕塑公司陕西公园玻璃钢雕塑优势玻璃钢雕塑网红成品玻璃钢花盆批发萍乡公园玻璃钢雕塑生产厂家上海进口玻璃钢雕塑省钱芜湖玻璃钢卡通人物雕塑吉林玻璃钢商场美陈香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化