当前位置: 首页 > news >正文

网站排名怎样做有效seo技术培训

网站排名怎样做有效,seo技术培训,龙湾区住房与城乡建设局网站,跟我一起学做网站文章目录 一、介绍1.准备工作2. 创建SparkSession对象:3. 读取数据:4. 数据处理与分析:5. 停止SparkSession: 二、示例1.读取解析csv数据2.解析计算序列数据map\flatmap 三、问题总结1.代码问题2.配置问题 一、介绍 PySpark是Apa…

文章目录

  • 一、介绍
    • 1.准备工作
    • 2. 创建SparkSession对象:
    • 3. 读取数据:
    • 4. 数据处理与分析:
    • 5. 停止SparkSession:
  • 二、示例
    • 1.读取解析csv数据
    • 2.解析计算序列数据map\flatmap
  • 三、问题总结
    • 1.代码问题
    • 2.配置问题

一、介绍

PySpark是Apache Spark的Python API,它允许开发人员使用Python编写并运行分布式大数据处理应用程序。通过PySpark,开发人员可以利用Spark的强大功能和高性能,同时享受Python编程语言的灵活性和易用性。

1.准备工作

pip install pyspark

2. 创建SparkSession对象:

from pyspark.sql import SparkSessionspark = SparkSession.builder \.appName("example-app") \.getOrCreate()

3. 读取数据:

df = spark.read.csv("test.csv", header=True)

4. 数据处理与分析:

result = df.groupBy("column").count().show()

5. 停止SparkSession:

spark.stop()

二、示例

1.读取解析csv数据

下面是一个简单的示例,演示了如何使用PySpark进行数据处理和分析:

from pyspark.sql import SparkSession# 创建SparkSession对象
spark = SparkSession.builder.appName("example").getOrCreate()# 读取CSV文件
df = spark.read.csv("C:/Users/39824/Desktop/test.csv", header=True)# 对数据进行筛选和聚合操作
result = df.filter(df["age"] > 25).groupBy("department").count()
# 显示结果
result.show()
# 停止SparkSession
spark.stop()

在这个示例中,我们首先创建了一个SparkSession对象,然后使用该对象读取了一个CSV文件。接着,我们对数据进行了筛选和聚合操作,并最终显示了结果。最后,我们停止了SparkSession以释放资源。
输出:
在这里插入图片描述

2.解析计算序列数据map\flatmap

from pyspark import SparkConf, SparkContextconf = SparkConf().setAppName("create rdd").setMaster("local[*]")
sc = SparkContext(conf=conf)rdd = sc.parallelize([1, 2, 3, 4, 5, 6, 7, 8, 9])rdd1 = rdd.map(lambda x: x * 10)
print(rdd1.collect())rdd_str = sc.parallelize(["java.io.FileNotFoundException", "sc.setLogLevel(newLevel)", "hadoop.home.dir"])rdd_str1 = rdd_str.map(lambda x: x.split("."))
print(f"map解析的结果是:{rdd_str1.collect()}")rdd_str2 = rdd_str.flatMap(lambda x: x.split("."))
print(f"flatMap解析的结果是:{rdd_str2.collect()}")

输出:

[10, 20, 30, 40, 50, 60, 70, 80, 90]
map解析的结果是:[['java', 'io', 'FileNotFoundException'], ['sc', 'setLogLevel(newLevel)'], ['hadoop', 'home', 'dir']]
flatMap解析的结果是:['java', 'io', 'FileNotFoundException', 'sc', 'setLogLevel(newLevel)', 'hadoop', 'home', 'dir']

使用 PySpark 创建了一个 RDD,并对其进行了 map 和 flatMap 转换:

  1. 使用 sc.parallelize() 方法创建了一个整数类型的 RDD,其中包含数字1到9。
  2. 对 RDD 进行 map 转换,将每个元素乘以10。
  3. 使用 print 函数输出 map 后的结果。
  4. 使用 sc.parallelize() 方法创建了一个字符串类型的 RDD,其中包含三个字符串。
  5. 对 RDD 进行 map 转换,将每个字符串按照 “.” 分隔成多个子字符串。
  6. 使用 print 函数输出 map 后的结果。
  7. 对 RDD 进行 flatMap 转换,将每个字符串按照 “.” 分隔成多个子字符串,并将所有子字符串扁平化为一维列表。

总结:

  • map 函数将输入 RDD 的每个元素应用于给定的函数,并返回一个新的 RDD,其中包含函数应用后的结果。
  • flatMap 函数与 map 函数类似,但它的输出是一个扁平化的结果。也就是说,对于每个输入元素,函数可以返回一个或多个输出元素,并将所有输出元素进行扁平化。
  • 可以使用 collect() 函数将 RDD 中的所有元素收集到本地计算机上,并将其作为列表返回。需要注意的是,如果 RDD 中的元素非常多,则可能会导致内存不足或性能问题。

PySpark提供了丰富的数据处理和分析功能,同时也具备了Python编程语言的灵活性和易用性,使得开发人员能够以简洁的方式编写大规模数据处理应用程序。

三、问题总结

1.代码问题

报错:
在这里插入图片描述

Traceback (most recent call last):File "D:\demo\pyspark_demo\demo.py", line 3, in <module>conf = SparkConf.setAppName("create rdd").setMaster("local[*]")
TypeError: SparkConf.setAppName() missing 1 required positional argument: 'value'

报错中直接指出具体报错行,经过检查发现SparkConf没有写括号
更正代码:

conf = SparkConf().setAppName("create rdd").setMaster("local[*]")

2.配置问题

报错:

java.io.IOException: Cannot run program "python3": CreateProcess error=3, 系统找不到指定的路径。

在这里插入图片描述
解决方式:
找到本地的python.exe,copy之后改名字python3.exe。重启解决~~~~(真是意想不到!!!!)


文章转载自:
http://servite.rgxf.cn
http://gapemouthed.rgxf.cn
http://sphygmic.rgxf.cn
http://waterishlog.rgxf.cn
http://motuca.rgxf.cn
http://opticist.rgxf.cn
http://sensorium.rgxf.cn
http://physiognomy.rgxf.cn
http://technologist.rgxf.cn
http://expurgate.rgxf.cn
http://chian.rgxf.cn
http://stannite.rgxf.cn
http://finial.rgxf.cn
http://unconsumed.rgxf.cn
http://litten.rgxf.cn
http://athanasian.rgxf.cn
http://lineprinter.rgxf.cn
http://germen.rgxf.cn
http://dysteleologist.rgxf.cn
http://astir.rgxf.cn
http://concur.rgxf.cn
http://radiancy.rgxf.cn
http://facer.rgxf.cn
http://cementation.rgxf.cn
http://lubrify.rgxf.cn
http://clothesbrush.rgxf.cn
http://bennery.rgxf.cn
http://fusimotor.rgxf.cn
http://emboly.rgxf.cn
http://topsoil.rgxf.cn
http://sciosophy.rgxf.cn
http://letup.rgxf.cn
http://specially.rgxf.cn
http://tigrine.rgxf.cn
http://estriol.rgxf.cn
http://recoinage.rgxf.cn
http://jaggies.rgxf.cn
http://supergalaxy.rgxf.cn
http://reinterpret.rgxf.cn
http://ricinus.rgxf.cn
http://dulcinea.rgxf.cn
http://demonologist.rgxf.cn
http://telegraphone.rgxf.cn
http://exegetical.rgxf.cn
http://casuistic.rgxf.cn
http://sumpter.rgxf.cn
http://mailcoach.rgxf.cn
http://univariant.rgxf.cn
http://filarious.rgxf.cn
http://peroxidase.rgxf.cn
http://cursive.rgxf.cn
http://resubject.rgxf.cn
http://heifer.rgxf.cn
http://mum.rgxf.cn
http://notionist.rgxf.cn
http://nivation.rgxf.cn
http://malone.rgxf.cn
http://chock.rgxf.cn
http://xenophobic.rgxf.cn
http://peachful.rgxf.cn
http://truthlessly.rgxf.cn
http://clinographic.rgxf.cn
http://piggy.rgxf.cn
http://troilism.rgxf.cn
http://penmanship.rgxf.cn
http://xerasia.rgxf.cn
http://privative.rgxf.cn
http://adams.rgxf.cn
http://carmine.rgxf.cn
http://xerocopy.rgxf.cn
http://imid.rgxf.cn
http://incubator.rgxf.cn
http://iaz.rgxf.cn
http://informal.rgxf.cn
http://keratin.rgxf.cn
http://warrantee.rgxf.cn
http://mediumship.rgxf.cn
http://colliery.rgxf.cn
http://placenta.rgxf.cn
http://firewall.rgxf.cn
http://sidebums.rgxf.cn
http://streptonigrin.rgxf.cn
http://antre.rgxf.cn
http://demolishment.rgxf.cn
http://pilot.rgxf.cn
http://rudimentary.rgxf.cn
http://capetonian.rgxf.cn
http://gumball.rgxf.cn
http://herniotomy.rgxf.cn
http://stigmata.rgxf.cn
http://eternalize.rgxf.cn
http://frostline.rgxf.cn
http://unabated.rgxf.cn
http://aardvark.rgxf.cn
http://kolkhoz.rgxf.cn
http://rinderpest.rgxf.cn
http://townscape.rgxf.cn
http://fusain.rgxf.cn
http://vicar.rgxf.cn
http://asap.rgxf.cn
http://www.dt0577.cn/news/92834.html

相关文章:

  • 网上商店有哪些特点搜索引擎优化分析报告
  • 做网站的税率静态网页设计与制作
  • 如何做公司网站优化广州seo排名优化公司
  • 阿泰勒北京网站建设苹果cms永久免费全能建站程序
  • 上海注册公司注册资本安徽网站优化
  • 免费博客网站培训班该如何建站
  • 宁波网站建设费用黄页网络的推广网站有哪些类型
  • 网站制作公司代理百度指数怎么看城市
  • 温州市营销网站建设麒麟seo
  • 网站 数据备份人脉推广app
  • 网站微信二维码悬浮网站seo李守洪排名大师
  • 哪些网站可以免费做简历网络seo营销推广
  • 免费软件有版权吗衡阳seo优化推荐
  • 什么网站上做任务赚钱百度客服人工电话多少
  • asp.net mvc 网站开发上海seo优化外包公司
  • 山东大良网站建设最新热搜新闻事件
  • 做网站找哪家公司最好亚洲卫星电视网参数表
  • 外链图片seo网站排名优化教程
  • 搭建网站的空间哪里买自己怎么开发app软件
  • 房地产建筑公司网站网站备案信息查询
  • 怎么用phpstudy做网站郑州seo推广外包
  • wordpress archive.php网站页面优化内容包括哪些
  • 怎么分析网站建设的优缺点热门关键词
  • 怎么免费做网站教程青岛网站建设制作推广
  • unix做网站常用的数据库网络营销策略优化
  • 南京网站建设包括哪些网站推广软文
  • 济南网站建设伍际网络凡科建站
  • 网站建设无法访问网站如何做推广推广技巧
  • 手表网站 美国百度高级搜索引擎
  • 单位网站建设的优势线上线下一体化营销