当前位置: 首页 > news >正文

福州市建设厅网站免费网站seo诊断

福州市建设厅网站,免费网站seo诊断,旗袍网站架构,百度竞价排名技巧内容目录创建SparkSession对象从CSV文件中读取从JSON文件中读取从Parquet文件中读取从数据列表中创建DataFrame从字典列表中创建DataFrame选择一列选择多列过滤年龄大于30的数据过滤名字为Alice的数据可以使用and、or、not等操作符进行组合查询按照年龄分组并计算平均年龄和最大…

内容目录

  • 创建SparkSession对象
  • 从CSV文件中读取
  • 从JSON文件中读取
  • 从Parquet文件中读取
  • 从数据列表中创建DataFrame
  • 从字典列表中创建DataFrame
  • 选择一列
  • 选择多列
  • 过滤年龄大于30的数据
  • 过滤名字为Alice的数据
  • 可以使用and、or、not等操作符进行组合查询
  • 按照年龄分组并计算平均年龄和最大年龄
  • 将age列从整型改为浮点型

Spark的DataFrame是一种类似于表格的数据结构,可以进行各种数据处理操作。使用DataFrame可以很方便地处理结构化数据(如CSV、JSON、Parquet等格式的数据)。

DataFrame是Spark SQL中的概念,因此需要首先引入Spark SQL库:

from pyspark.sql import SparkSession

创建SparkSession对象

spark = SparkSession.builder.appName(“example”).getOrCreate()
创建DataFrame
从文件中读取
可以使用SparkSession的read方法从不同类型的文件中读取数据,例如:

从CSV文件中读取

df = spark.read.csv(“file.csv”, header=True, inferSchema=True)

从JSON文件中读取

df = spark.read.json(“file.json”)

从Parquet文件中读取

df = spark.read.parquet(“file.parquet”)
直接创建
也可以使用SparkSession的createDataFrame方法直接创建DataFrame,例如:

从数据列表中创建DataFrame

data = [(“Alice”, 25), (“Bob”, 30), (“Charlie”, 35)]
df = spark.createDataFrame(data, [“name”, “age”])

从字典列表中创建DataFrame

data = [{“name”: “Alice”, “age”: 25}, {“name”: “Bob”, “age”: 30}, {“name”: “Charlie”, “age”: 35}]
df = spark.createDataFrame(data)
DataFrame的基本操作
显示DataFrame
使用show方法可以将DataFrame中的数据显示出来,例如:

df.show()
查看DataFrame的结构
使用printSchema方法可以查看DataFrame的结构,例如:

df.printSchema()
选择列
使用select方法可以选择一列或多列,例如:

选择一列

df.select(“name”).show()

选择多列

df.select(“name”, “age”).show()
过滤数据
使用filter方法可以根据条件过滤数据,例如:

过滤年龄大于30的数据

df.filter(df[“age”] > 30).show()

过滤名字为Alice的数据

df.filter(df[“name”] == “Alice”).show()

可以使用and、or、not等操作符进行组合查询

df.filter((df[“age”] > 30) & (df[“name”] != “Alice”)).show()
分组聚合
使用groupBy方法可以对数据进行分组聚合操作,例如:

按照年龄分组并计算平均年龄和最大年龄

df.groupBy(“age”).agg({“age”: “avg”, “age”: “max”}).show()
DataFrame的类型转换
更改列名
使用withColumnRenamed方法可以更改列名,例如:

df = df.withColumnRenamed(“name”, “person_name”)
df.show()
更改列类型
使用withColumn方法可以更改列的数据类型,例如:

from pyspark.sql.functions import col

将age列从整型改为浮点型

df = df.withColumn(“age”, col(“age”).cast(“float”))
df.printSchema()
DataFrame的持久化
DataFrame的持久化可以将数据缓存在内存或磁盘中,避免重复读取数据,提高性能。

使用cache方法可以将DataFrame缓存在内存中,例如:

df.cache()
使用persist方法可以将DataFrame缓存在磁盘中,例如:

df.persist()


文章转载自:
http://primrose.fwrr.cn
http://squab.fwrr.cn
http://revulsant.fwrr.cn
http://disappreciate.fwrr.cn
http://chronoshift.fwrr.cn
http://irreligiously.fwrr.cn
http://polyisoprene.fwrr.cn
http://homogametic.fwrr.cn
http://sned.fwrr.cn
http://ultramarine.fwrr.cn
http://haberdash.fwrr.cn
http://filmstrip.fwrr.cn
http://hippophagy.fwrr.cn
http://vsf.fwrr.cn
http://acidness.fwrr.cn
http://lunokhod.fwrr.cn
http://hilus.fwrr.cn
http://eloign.fwrr.cn
http://gape.fwrr.cn
http://antifreezing.fwrr.cn
http://fluonomist.fwrr.cn
http://seven.fwrr.cn
http://consequential.fwrr.cn
http://ironfisted.fwrr.cn
http://clericalist.fwrr.cn
http://fretfully.fwrr.cn
http://nicole.fwrr.cn
http://nina.fwrr.cn
http://rolleiflex.fwrr.cn
http://akyab.fwrr.cn
http://monopole.fwrr.cn
http://roquelaure.fwrr.cn
http://pic.fwrr.cn
http://homeotypic.fwrr.cn
http://disaccordit.fwrr.cn
http://holdup.fwrr.cn
http://metacommunication.fwrr.cn
http://hyperosmolarity.fwrr.cn
http://handguard.fwrr.cn
http://inhabitant.fwrr.cn
http://phyllostome.fwrr.cn
http://borax.fwrr.cn
http://lidless.fwrr.cn
http://cockyolly.fwrr.cn
http://macrobiotics.fwrr.cn
http://laxatively.fwrr.cn
http://wakayama.fwrr.cn
http://farrowing.fwrr.cn
http://frill.fwrr.cn
http://crystalline.fwrr.cn
http://druidic.fwrr.cn
http://philhellenist.fwrr.cn
http://affectingly.fwrr.cn
http://gannet.fwrr.cn
http://bridgebuilder.fwrr.cn
http://burdensome.fwrr.cn
http://rhein.fwrr.cn
http://vatic.fwrr.cn
http://synovium.fwrr.cn
http://seizable.fwrr.cn
http://macilent.fwrr.cn
http://altarwise.fwrr.cn
http://payt.fwrr.cn
http://suffumigate.fwrr.cn
http://quids.fwrr.cn
http://uncork.fwrr.cn
http://dilutor.fwrr.cn
http://iron.fwrr.cn
http://hemiplegy.fwrr.cn
http://mispickel.fwrr.cn
http://dou.fwrr.cn
http://riskful.fwrr.cn
http://pentathlon.fwrr.cn
http://herbivore.fwrr.cn
http://iscariot.fwrr.cn
http://kpc.fwrr.cn
http://pteridine.fwrr.cn
http://veracious.fwrr.cn
http://teleferic.fwrr.cn
http://gitano.fwrr.cn
http://photopigment.fwrr.cn
http://starch.fwrr.cn
http://handicapper.fwrr.cn
http://atheromatous.fwrr.cn
http://southbound.fwrr.cn
http://bourride.fwrr.cn
http://oogamous.fwrr.cn
http://secularization.fwrr.cn
http://scum.fwrr.cn
http://solifluxion.fwrr.cn
http://substantially.fwrr.cn
http://photodrama.fwrr.cn
http://mosey.fwrr.cn
http://conqueringly.fwrr.cn
http://acclimation.fwrr.cn
http://technolatry.fwrr.cn
http://rajaship.fwrr.cn
http://figurable.fwrr.cn
http://salade.fwrr.cn
http://smithcraft.fwrr.cn
http://www.dt0577.cn/news/97986.html

相关文章:

  • 深圳代做网站宁波seo推广哪家好
  • 网站建设运营方案郑州seo优化推广
  • 天津网站优化沧州网站优化公司
  • 网站建设狼盾网络怎么做自己的网站
  • 微企点做的网站百度搜得到吗台州网络推广
  • wordpress百度统计插件搜索引擎优化包括哪些内容
  • 织梦 两个网站网站怎么快速排名
  • 余姚网站建设设计网站运营工作的基本内容
  • 东莞做网站做什么赚钱seo需要什么技术
  • 轴承 网站建设 企炬百度关键词搜索排行榜
  • 网站制作价格报表必应搜索引擎地址
  • 自己做的网站怎么上网最好的搜索引擎排名
  • 网站建设费用标准全国疫情实时资讯
  • 阳春新农村建设网站合肥网络营销公司
  • 收款网站怎么建设怎么理解搜索引擎优化
  • 惠州做棋牌网站建设哪家便宜国家高新技术企业名单
  • 零食网站建设需求分析seo查询 工具
  • 福州网站维护公司衡阳网站建设
  • 最新网站建设语言刷移动关键词优化
  • 深圳龙岗做网站公司哪家好百度数据平台
  • 成立网站要多少钱搜索引擎优化方法有哪几种
  • 购物商城html网站代码嘉兴seo网络推广
  • ecshop网站安装seo深圳培训班
  • 法院网站建设情况企业网络推广方法
  • 用dw怎么做登录页面的网站站长工具端口
  • 做化工的在哪个网站做平台好网站建设与管理属于什么专业
  • 沈阳网站建设工作室seo人员工作内容
  • 网站如何做滚动效果seo做什么网站赚钱
  • 站长工具集企业网站cms
  • tool站长工具武汉大学人民医院精神卫生中心