当前位置: 首页 > news >正文

武汉老牌网站建设公司网络域名综合查询

武汉老牌网站建设公司,网络域名综合查询,网站委托书找谁做,软件公司网站素材一、RDD持久化 1、不采用持久化操作 查看要操作的HDFS文件 以集群模式启动Spark Shell 按照图示进行操作,得RDD4和RDD5 查看RDD4内容,会从RDD1到RDD2到RDD3到RDD4跑一趟 显示RDD5内容,也会从RDD1到RDD2到RDD3到RDD5跑一趟 2、采用持久化…

一、RDD持久化

1、不采用持久化操作
查看要操作的HDFS文件
在这里插入图片描述
以集群模式启动Spark Shell
在这里插入图片描述
按照图示进行操作,得RDD4和RDD5
在这里插入图片描述
查看RDD4内容,会从RDD1到RDD2到RDD3到RDD4跑一趟
在这里插入图片描述
显示RDD5内容,也会从RDD1到RDD2到RDD3到RDD5跑一趟

在这里插入图片描述
2、采用持久化操作
在这里插入图片描述
计算RDD4,就是基于RDD3缓存的数据开始计算,不用从头到尾跑一趟
在这里插入图片描述
计算RDD5,就是基于RDD3缓存的数据开始计算,不用从头到尾跑一趟
在这里插入图片描述

二、存储级别

案例演示设置存储级别
在这里插入图片描述

package net.cxf.rdd.day05import org.apache.log4j.{Level, Logger}
import org.apache.spark.storage.StorageLevel
import org.apache.spark.{SparkConf, SparkContext}import java.awt.SystemTray/*** 功能:* 作者:cxf* 日期:2023年05月06日*/
object SetStorageLevel {def main(args: Array[String]): Unit = {//创建Spark配置对象val conf = new SparkConf().setAppName("SetStorageLevel") //设置应用名称.setMaster("local[*]") //设置主节点位置(本地调试>// 基于Spark配置对象创建Spark容器val sc = new SparkContext(conf)//去除Spark运行信息Logger.getLogger("org").setLevel(Level.OFF)Logger.getLogger("com").setLevel(Level.OFF)System.setProperty("spark.ui.showConsoleProgress", "false")Logger.getRootLogger().setLevel(Level.OFF)//创建RDDval rdd = sc.textFile("hdfs://master:9000/park/words.txt")//将rdd标记为持久化,采用默认存储级别- StorageLevel.MEMORY_ONLYrdd.persist() //无参持久化方法//对rdd做扁平映射,得到rdd1val rdd1 = rdd.flatMap(_.split(" "))//将rdd1持久化都磁盘rdd1.persist(StorageLevel.DISK_ONLY)//将rdd1映射成二元组,得到rdd2val rdd2 = rdd1.map((_, 1))//将rdd2持久化到内存,溢出的数据持久化到磁盘rdd2.persist(StorageLevel.MEMORY_AND_DISK)//第一次行动算子,对标记为持久化的RDD进行不同级别的持久化曹println("元素个数:" + rdd2.count)//第二次行动算子,直接利用rdd2的持久化数据进行操作,无须从头进行计算rdd2.collect.foreach(println)}}

运行程序,查看结果

在这里插入图片描述

三、利用Spark WebUI查看缓存

最好重启Spark Shell
在这里插入图片描述
(一)创建RDD并标记为持久化
在这里插入图片描述
(二)Spark WebUI查看RDD存储信息
在这里插入图片描述
收集RDD数据
在这里插入图片描述
刷新WebUI,发现出现了一个ParallelCollectionRDD的存储信息,该RDD的存储级别为MEMORY,持久化的分区为8,完全存储于内存中。
在这里插入图片描述
单击ParallelCollectionRDD超链接,可以查看该RDD的详细存储信息
在这里插入图片描述
执行以下命令,创建rdd2,并将rdd2持久化到磁盘
在这里插入图片描述
刷新上述WebUI,发现多了一个MapPartitionsRDD的存储信息,该RDD的存储级别为DISK,持久化的分区为8,完全存储于磁盘中。
在这里插入图片描述
(三)将RDD从缓存中删除
在这里插入图片描述
刷新上述WebUI,发现只剩下了MapPartitionsRDD,ParallelCollectionRDD已被移除。
在这里插入图片描述

http://www.dt0577.cn/news/13478.html

相关文章:

  • 贺州网站制作google seo是什么
  • 可以将自己做的衣服展示的网站nba实力榜最新排名
  • wordpress读取txtseo优化的主要任务
  • 旅行社网站建设方案书山东16市最新疫情
  • 郴州seo快速排名seowhy教研室
  • 做电影网站要不要收费苏州百度推广
  • 网站根目录文件名微信怎么做推广
  • 怎么自己做优惠券网站关键词排名提高
  • 如何做彩票网站代理seo服务外包报价
  • 网站开发需要甲方提供什么全国十大跨境电商排名
  • 丝绸之路网站平台建设百度爱采购客服电话
  • 2021不良正能量免费网站企业网站怎么优化
  • 国内大型php网站建设商品推广
  • 个人网站做企业备案站长工具精品
  • 长沙网站排名如何优化网站排名
  • 网站流量带宽行业关键词一览表
  • 杭州网络公司网站如何做好互联网营销推广
  • 知道一个网站怎么知道是谁做的百度优化神起网络游戏推广平台
  • 站长工具在线查询营销型外贸网站建设
  • 做网站用的云控制台防晒霜营销软文
  • 广州白云区最新新闻成都百度seo推广
  • 如何在年报网站上做遗失公告seo技术306
  • url怎么做网站怎么做app推广代理
  • 怎么做直播室的网站新媒体营销策略
  • wordpress浏览器版本企业seo服务
  • 博罗网站开发今日新闻事件
  • 做网站去哪里找广告主企业网络营销策划
  • 顺义做网站公司百度网盘搜索免费资源
  • 网站建设与管理简单么seo霸屏
  • wordpress编辑器存内容徐州百度seo排名优化