当前位置: 首页 > news >正文

池州网站建设怎么样企业宣传片

池州网站建设怎么样,企业宣传片,南宁seo外包要求,成都商城网站建设地址spark的代码分为两种 本地代码在driver端直接解析执行没有后续 集群代码,会在driver端进行解析,然后让多个机器进行集群形式的执行计算 spark-shell --master spark://nn1:7077 --executor-cores 2 --executor-memory 2G sc.textFile("/home/ha…

spark的代码分为两种

  • 本地代码在driver端直接解析执行没有后续

  • 集群代码,会在driver端进行解析,然后让多个机器进行集群形式的执行计算

spark-shell --master spark://nn1:7077 --executor-cores 2 --executor-memory 2G
sc.textFile("/home/hadoop/a.txt")
org.apache.spark.rdd.RDD[String] = /home/hadoop/a.txt MapPartitionsRDD[1] at textFile at

rdd弹性分布式数据集合

  • 如果是sc调用的方法会在集群中执行
  • rdd调用的方法也会集群执行
sc.textFile("/home/hadoop/a.txt")

不是单机代码,但是文件不能再某一个机器上,因为这个命令所有的机器都会执行。

这个路径一定要放在hdfs中

问题:第一行代码就读取了数据,为什么第一行没有出现错误?

spark中的方法[算子]它是分为两种

  • 转换类算子,定义逻辑,并且调用完毕以后具有返回值的,调用算子以后是不是返回rdd
  • 行动类算子,触发计算,并且没有rdd的返回

代码的整体逻辑是先使用转换类算子定义逻辑,但是不执行,一旦使用action算子就会触发运算,整体才执行,这样的设计能够最大化的减少内存的使用。

所以上传hdfs文件,读取

hdfs dfs -put /home/hadoop/a.txt /

spark-shell整体代码

scala> //在spark-env.sh中配置HADOOP_CONF_DIR,默认会读取hdfs中的文件scala> sc.textFile("/a.txt")
res6: org.apache.spark.rdd.RDD[String] = /a.txt MapPartitionsRDD[5] at textFile at <console>:26
//放入数据到hdfs中
scala> res6.flatMap(_.split(" "))
res7: org.apache.spark.rdd.RDD[String] = MapPartitionsRDD[6] at flatMap at <console>:27scala> res7.map((_,1))
res8: org.apache.spark.rdd.RDD[(String, Int)] = MapPartitionsRDD[7] at map at <console>:27scala> res8.groupBy(_._1)
res9: org.apache.spark.rdd.RDD[(String, Iterable[(String, Int)])] = ShuffledRDD[9] at groupBy at <console>:27
//分组完毕的返回值不再是map而是RDD[String,Iterable]
scala> res9.mapValues(_.size)
res10: org.apache.spark.rdd.RDD[(String, Int)] = MapPartitionsRDD[10] at mapValues at <console>:27
//mapValues在scala中只能作用在map集合上,现在可以作用在RDD[k,v]
scala> res10.foreach(println)
//打印数据的时候每个机器都有,因为是分布式执行的

http://www.dt0577.cn/news/44363.html

相关文章:

  • 网站开发流程抚州百度最新财报
  • 宜昌企业网站建设西安网站制作建设
  • ps高手教学网站seo搜索引擎排名优化
  • python做公司网站杭州关键词优化服务
  • 线报网站如何做北京网络推广公司排行
  • 平面设计海报作品欣赏太原seo关键词排名优化
  • 江门营销型网站建设公司网站平台怎么推广
  • 网站怎么做可留言功能东莞关键词优化实力乐云seo
  • 网站建设程序员提成杭州网站建设方案优化
  • 在电脑上怎么创建微网站吗如何进行网站的推广
  • 移动端手机网站制作怎么给产品找关键词
  • 自己可以做网站推广吗电脑编程培训学校
  • wordpress主题 摄影搜索引擎seo如何优化
  • 网站描文本怎么做seo免费优化网站
  • 凡建网站百度搜索历史记录
  • 项目的网站是用JSP做的吗外贸建站教程
  • 网站设计的需求分析快抖霸屏乐云seo
  • dynamo wordpress主题镇江seo快速排名
  • 百度网站怎么做视频教程电子商务营销
  • vps 需刷新几次才能打开网站新东方考研班收费价格表
  • 婚介网站怎么做百度分析工具
  • 邯郸专业做网站哪里有seo推广优化公司哪家好
  • 做推广都有什么网站深圳seo外包
  • 广告策划书不包括什么内容网店seo关键词
  • 请问的网站开发培训 有知道的吗市场推广外包团队
  • 乌兰察布市建设银行网站西安疫情最新数据消息5分钟前
  • 网站系统源码大数据平台
  • 山东青岛网站建设公司百度开发平台
  • 建永久网站排名优化培训
  • b2b网站开发公司seo搜索推广