当前位置: 首页 > news >正文

做网站需要每年都交钱吗外链在线生成

做网站需要每年都交钱吗,外链在线生成,重庆专业网站定制,wordpress会员模块一、Spark安装 1.相关链接 Spark安装和编程实践(Spark3.4.0)_厦大数据库实验室博客 (xmu.edu.cn) 2.安装Spark(Local模式) 按照文章中的步骤安装即可 遇到问题:xshell以及xftp不能使用 解决办法: 在…

一、Spark安装

1.相关链接

Spark安装和编程实践(Spark3.4.0)_厦大数据库实验室博客 (xmu.edu.cn)

2.安装Spark(Local模式)

按照文章中的步骤安装即可

遇到问题:xshell以及xftp不能使用

解决办法:

在linux使用镜像网站进行下载:wget https://mirrors.tuna.tsinghua.edu.cn/apache/spark/spark-3.5.1/spark-3.5.1-bin-without-hadoop.tgz

二、编程实践

1.使用sbt对Scala独立应用程序进行编译打包

同样在Linux中使用wget下载sbt安装文件sbt-1.9.0.tgz:

wget https://github.com/sbt/sbt/releases/download/v1.9.0/sbt-1.9.0.tgz

注意:由于sbt没有国内镜像,下载较慢(大概两个小时)

2.其他按照上面教程中安装即可
3.实验报告要求:

读取HDFS系统文件“/user/hadoop/test.txt”(如果该文件不存在,请先创建)

(1)方法 1:使用 hadoop fs -put 命令上传本地文件

        1).首先,你需要有一个本地文件,假设你有一个名为 local_test.txt 的本地文件,其中包含你想要写入 HDFS 的内容。

        2).使用以下命令将本地文件上传到 HDFS:

        如果你是集群,需要打开所有几点,再启动hadoop,否则报错(处于安全模式

hadoop fs -put /path/to/local_test.txt /user/data/test.txt

        将 /path/to/local_test.txt 替换为你的本地文件的实际路径。

(2)方法 2:直接在 HDFS 上创建文件并写入内容

        1).使用 hadoop fs -cat 命令直接在 HDFS 上创建文件并写入内容:

hadoop fs -cat > /user/data/test.txt

        这将创建一个名为 test.txt 的空文件。

        2).现在你可以写入内容到这个文件中。输入你想要写入的内容,然后按 Ctrl+D 结束输入。

This is the content of the test.txt file.

        3).按 Ctrl+D 结束输入后,test.txt 文件将包含你刚刚输入的内容。

        请注意,这些命令需要在 Hadoop 集群的节点上运行,或者你需要通过 SSH 登录到集群中的一个节点。如果你的 Hadoop 集群配置了 Web 界面(如 Hue 或 Ambari),你也可以通过 Web 界面来上传文件和查看文件内容。

4.通过如下代码将整个应用程序打包成 JAR(首次运行同样需要下载依赖包 ):
/usr/local/sbt/sbt package

注意:这一步要保证你的Linux系统中所有文件夹名称为英文

5.建立一个名为 SimpleApp.scala 的文件

相关代码:

/* SimpleApp.scala */
import org.apache.hadoop.fs.{FileSystem, Path}
import org.apache.hadoop.conf.Configurationobject SimpleApp {def main(args: Array[String]): Unit = {val conf = new Configuration()val fs = FileSystem.get(conf)val path = new Path("/user/data/test.txt")val isExists = fs.exists(path)if (!isExists) {val outputStream = fs.create(path)outputStream.close()}val inputStream = fs.open(path)val lineCount = scala.io.Source.fromInputStream(inputStream).getLines().sizeprintln(s"File line count: $lineCount")inputStream.close()}
}

注意:上述代码中的val path = new Path("/user/data/test.txt"),要替换为你的test.txt的路径

6.在simple.sbt中添加如下内容,声明该独立应用程序的信息以及与 Spark 的依赖关系:
name := "Simple Project"
version := "1.0"
scalaVersion := "2.12.18"
libraryDependencies += "org.apache.hadoop" % "hadoop-client" % "2.10.1"

  注意:你的scala和hadoop版本要与代码中的相同

7.通过 spark-submit 运行程序

教程给的指令缺少文件编码格式,需要指定编码格式,以下为修改后的指令

/usr/local/spark-3.5.1/bin/spark-submit --class "SimpleApp" --driver-java-options "-Dfile.encoding=UTF-8" ~/sparkapp/target/scala-2.12/simple-project_2.12-1.0.jar
/usr/local/spark-3.5.1/bin/spark-submit --class "SimpleApp" --driver-java-options "-Dfile.encoding=UTF-8" ~/sparkapp/target/scala-2.12/simple-project_2.12-1.0.jar 2>&1 | grep "Lines with a:"

注意:需要更改你的spark安装路径

http://www.dt0577.cn/news/21384.html

相关文章:

  • 百度怎么做开锁网站搜索引擎网站优化推广
  • 网站开发的可行性研究报告关于进一步优化
  • 软件开发培训视频seo网络优化日常工作内容
  • 网站怎么做移动的图片武汉谷歌seo
  • wordpress网站打开很卡怎样申请自己的电商平台
  • 视频网站如何优化开源seo软件
  • 帮别人做网站如何备案2022磁力链接搜索引擎推荐
  • 二级目录 Wordpressseo排名优化软件有
  • 平台建设费用包括哪些seo是什么及作用
  • 51zwd一起做网站广州域名估价
  • 群晖nas做网站性能google play商店
  • 云服务器和网站空间手机怎么创建网站
  • 免费请美女做爰网站百度投诉中心24小时电话
  • 做网站需要准备什么材料如何做网络推广外包
  • 青海省建设厅备案网站竞价推广外包托管
  • 如何用front怕个做网站河北seo技术
  • 网页制作的公司网站seo排名优化推广报价
  • 网站优化排名易下拉稳定seo推广软件哪个好
  • 网站设计哪家便宜百度客服中心人工在线
  • 做卡通的素材网站一键优化下载安装
  • 阎良网站建设如何做一个自己的网站
  • 做网站比较好的公司全国新冠疫情最新消息
  • 专门做鞋的网站企业百度推广
  • 网站推广策略国产搜什么关键词最好看
  • 注册商标符号win7系统优化软件
  • 网站 英语广州网站优化方案
  • 个人网站建设流程网站seo优化有哪些方面
  • 如何建立自己网站教程百度上做推广怎么收费
  • 网站建设用什么软件好网站推广seo
  • 网站开发工程师和前端搜索量查询百度指数