当前位置: 首页 > news >正文

建设银行长沙招聘网站奇葩网站100个

建设银行长沙招聘网站,奇葩网站100个,广东涂料网站建设,wordpress 前端页面网上一堆人根本对计算框架一知半解就出来糊弄人,常见解答有: spark是基于内存计算,所以快。这跟废话似的,mr计算的时候不也是基于内存? mr shuffle落盘。这也是胡扯, spark shuffle不落盘? 实际…

网上一堆人根本对计算框架一知半解就出来糊弄人,常见解答有:
spark是基于内存计算,所以快。这跟废话似的,mr计算的时候不也是基于内存?
mr shuffle落盘。这也是胡扯, spark shuffle不落盘?

实际上,如果一个job只有一个map task和reduce task,那么spark并不会比mr快很多。spark快的真正原因是,当一个job具有多个stage时, 我们将这个job表示为[map1,reduce1,map2,reduce2...reducen−1,mapn][map_1, reduce_1, map_2, reduce_2...reduce_{n-1}, map_n][map1,reduce1,map2,reduce2...reducen1,mapn],那么mr会在每一个reducen−1reduce_{n-1}reducen1mapnmap_nmapn之间进行一次落盘和一次文件读取,而spark因为可以将窄依赖的算子合并为一个stage,所以在reducen−1reduce_{n-1}reducen1mapnmap_nmapn之间是不涉及落盘的,直接基于内存计算。

举个小例子加深理解,假设一个job涉及两个stage,那么mr和spark的运行过程是这样的:
在这里插入图片描述
可以看到, spark相较于MR而言,少了一次hdfs文件落盘和一次文件读取,如果一个job有nnn个stage,比方说是机器学习算法,那么spark可以节省n−1n-1n1次文件落盘、读取。因此速度会快很多。

http://www.dt0577.cn/news/24964.html

相关文章:

  • 网站开发交付验收文档百度云登录
  • 做淘宝客网站要多少钱日照网络推广
  • 少儿美术专业网站做课件app拉新项目推广代理
  • 包装设计教程天津优化加盟
  • 美食网站开发报告建设网站的步骤
  • 江苏州 网站制作网络营销什么意思
  • 质量好网站建设商家国内新闻大事20条
  • 做网站需要会写代码百度公司在哪
  • 设计师采集网站网片
  • 建个淘宝那样的网站需要多少钱做互联网项目怎么推广
  • 宁波网站建设明细报价防控措施持续优化
  • 深圳做网站应该怎么做三只松鼠网络营销策略
  • 长安网站制作公司宁波网站推广哪家公司好
  • 什么网站可以接模具做和生活app下载安装最新版
  • 公司建网站费用怎么做分录查找关键词的工具叫什么
  • 网上做家教哪个网站真正永久免费网站建设
  • 点餐网站怎么做b站推广有用吗
  • 南宁软件优化网站建设聊城疫情最新消息
  • 网站做等保是什么意思关键词挖掘ppt
  • 网站建设制作包括哪些方面重庆电子商务网站seo
  • 做网站怎么选择服务器的大小谷歌seo外链
  • 沈阳做网站多少钱台州网站建设平台
  • ruby做网站网络做推广公司
  • 遵义网站网络营销的主要方法
  • 程序员给女盆友做的网站成人编程培训机构排名前十
  • 建自己的网站做外贸自己在家做电商
  • php网站开发方案百度首页关键词推广
  • 怎么自己做个免费网站吗网站推广优化招聘
  • 武汉麦诺信网站建设aso优化推广
  • 购物网站的图片轮播怎么做手机系统优化软件哪个好