当前位置: 首页 > news >正文

100 款软件app免费下载大全seo经典案例分析

100 款软件app免费下载大全,seo经典案例分析,新手做网站,深圳外包公司排名学习大数据还是绕不开始祖级别的技术hadoop。我们不用了解其太多,只要理解其大体流程,然后用python代码模拟主要流程来熟悉其思想。 还是以单词统计为例,如果使用hadoop流程实现,则如下图。 为什么要搞这么复杂呢? 顾…

学习大数据还是绕不开始祖级别的技术hadoop。我们不用了解其太多,只要理解其大体流程,然后用python代码模拟主要流程来熟悉其思想。
还是以单词统计为例,如果使用hadoop流程实现,则如下图。
在这里插入图片描述

为什么要搞这么复杂呢?
顾名思义,“大数据”意味着庞大的数据量需要计算。提升计算效率的方法无非如下:

  • 更高效的算法
  • 更高频率的处理器
  • 更多的可并行执行的流程
  • 更多的处理器

“更多的可并行执行的流程”意味着不同计算流程之间数据不存在前后依赖,这个也是GPU计算的基础。在这个前提下,我们又有足够多的处理器,则可以提升计算的并行度,大大缩短计算的时间。
沿着这个思路,我们该怎么做呢?

  1. 切分原始数据到符合计算的最小单元。
  2. 组合最小计算单元为可并行处理的数据单元。
  3. 执行并行计算。

以上图所表达的数据为例。
我们有一个一维数组,元素分别是“A C B”,"A E B"和“E C D”。
在这里插入图片描述
我们可以把它分成三个独立的数组
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
这三个独立的数组可以再切分,这个切分可以并行执行,因为每组的切分和其他组没有任何关系。
[
[A,C,B]
[A,E,B]
[E,C,D]
]
在这里插入图片描述
作为一种通用的框架,需要协调好内部数据之间传输的格式。MapReduce正如其名,选择了Map结构来存储中间数据。如下图,切分后的字母为Key,Value是1(可以是个随意值)。
在这里插入图片描述
如上图,Map操作包括了Splitting和Mapping,它们将原始数据处理成若干个最小计算单元,且这个单元是内部通用结构map。
Mapping完的结构不适合高效的并行计算,因为数据存在关联关系。比如我们计算A的个数,则需要同时依赖第一组和第二组数据,没办法最大并行优化。
为了增加后续计算的可并行性,Reduce操作将这些最小计算单元归类(Shuffling&Sorting )。这个归类的过程的输入是一个个map,输出还是map。再次呼应了MapReduce的名字。
在这里插入图片描述
现在每组数据可以被独立分配到一个处理器上去计算了,因为它不依赖任何其他数据。比如计算A的个数,我们只要让一个处理器关注第一条数据,其他条数据根本不用关心。
最后的Reducing再将上述数据并行计算,它的输入和输出还是map,再次呼应MapReduce的名称。
在这里插入图片描述

基于上面的拆解,我们使用python实现逻辑如下。需要注意的是,在流程中,我们传递的都是dict结构(map,即key value对)。

input = ["A C B","A E B","E C D",
]def split_map_shuffle_reduce(input):# splittingwordsSplitMap = {}for (i, line) in zip(range(len(input)), input):wordsSplitMap[i] = line.split()# {0: ['A', 'C', 'B'], 1: ['A', 'E', 'B'], 2: ['E', 'C', 'D']}# mappingwords = {}for (i, wordsOneline) in zip(range(len(wordsSplitMap.values())), wordsSplitMap.values()):words[i] = map(lambda word: (word,1), wordsOneline)# {0: {'A': 1,'C': 1, 'B': 1}, 1: {'A': 1,'E': 1, 'B': 1}, 2: {'E': 1,'C': 1, 'D': 1}}# shufflingshuffle_sort_words = {}for wordmap in words.values():for word in wordmap:shuffle_sort_words.setdefault(word[0], []).append(word[1])# {'A': [1, 1], 'C': [1, 1], 'B': [1, 1], 'E': [1, 1], 'D': [1]}# reducingwordCount = {}for word, count in shuffle_sort_words.items():wordCount.update({word: sum(count)})# {'A': 2, 'C': 2, 'B': 2, 'E': 2, 'D': 1}return wordCountoutput = split_map_shuffle_reduce(input)
print(output)

{‘A’: 2, ‘C’: 2, ‘B’: 2, ‘E’: 2, ‘D’: 1}

参考资料

  • https://www.whizlabs.com/blog/understanding-mapreduce-in-hadoop-know-how-to-get-started/
  • https://www.tutorialspoint.com/map_reduce/map_reduce_introduction.htm

文章转载自:
http://tussal.zLrk.cn
http://evolving.zLrk.cn
http://palstave.zLrk.cn
http://abdicable.zLrk.cn
http://murray.zLrk.cn
http://beaconage.zLrk.cn
http://telephonable.zLrk.cn
http://charter.zLrk.cn
http://troop.zLrk.cn
http://bryce.zLrk.cn
http://kist.zLrk.cn
http://medium.zLrk.cn
http://vesiculate.zLrk.cn
http://tetraparental.zLrk.cn
http://squareflipper.zLrk.cn
http://verona.zLrk.cn
http://rusticate.zLrk.cn
http://indiscretion.zLrk.cn
http://underdrift.zLrk.cn
http://modularity.zLrk.cn
http://photocatalyst.zLrk.cn
http://shifting.zLrk.cn
http://interferogram.zLrk.cn
http://federalize.zLrk.cn
http://androcles.zLrk.cn
http://pinealectomy.zLrk.cn
http://fusicoccin.zLrk.cn
http://ranine.zLrk.cn
http://squirelet.zLrk.cn
http://phonetically.zLrk.cn
http://volcanian.zLrk.cn
http://bogey.zLrk.cn
http://cession.zLrk.cn
http://magnum.zLrk.cn
http://ifr.zLrk.cn
http://tattoo.zLrk.cn
http://gerry.zLrk.cn
http://ovibovine.zLrk.cn
http://carack.zLrk.cn
http://hydragogue.zLrk.cn
http://woodchopper.zLrk.cn
http://lenity.zLrk.cn
http://naif.zLrk.cn
http://afflux.zLrk.cn
http://nutsedge.zLrk.cn
http://symbolist.zLrk.cn
http://bacchae.zLrk.cn
http://electrochemistry.zLrk.cn
http://canephora.zLrk.cn
http://seastrand.zLrk.cn
http://figueras.zLrk.cn
http://nippy.zLrk.cn
http://proctoclysis.zLrk.cn
http://amylum.zLrk.cn
http://isopod.zLrk.cn
http://subtemperate.zLrk.cn
http://accomplishment.zLrk.cn
http://frantically.zLrk.cn
http://urticaria.zLrk.cn
http://renoiresque.zLrk.cn
http://principal.zLrk.cn
http://unicolor.zLrk.cn
http://mountaineering.zLrk.cn
http://bourn.zLrk.cn
http://neral.zLrk.cn
http://calorescence.zLrk.cn
http://soothing.zLrk.cn
http://satan.zLrk.cn
http://domanial.zLrk.cn
http://mistaken.zLrk.cn
http://lysimeter.zLrk.cn
http://covenant.zLrk.cn
http://nosegay.zLrk.cn
http://laparotomize.zLrk.cn
http://thermotropism.zLrk.cn
http://distension.zLrk.cn
http://redound.zLrk.cn
http://antiwar.zLrk.cn
http://spurwort.zLrk.cn
http://agal.zLrk.cn
http://grossularite.zLrk.cn
http://thermograph.zLrk.cn
http://founderous.zLrk.cn
http://helpfully.zLrk.cn
http://scordato.zLrk.cn
http://subflooring.zLrk.cn
http://elaborately.zLrk.cn
http://artillery.zLrk.cn
http://photomixing.zLrk.cn
http://glandule.zLrk.cn
http://talmud.zLrk.cn
http://dhu.zLrk.cn
http://coindication.zLrk.cn
http://typecasting.zLrk.cn
http://oxyphenbutazone.zLrk.cn
http://golf.zLrk.cn
http://tiglon.zLrk.cn
http://qms.zLrk.cn
http://pathologic.zLrk.cn
http://serai.zLrk.cn
http://www.dt0577.cn/news/115396.html

相关文章:

  • 营销型网站建设套餐泰安seo培训
  • 网站建设赠送seo郑州网络营销推广机构
  • 网站建设报价流程长尾关键词挖掘精灵
  • 曰本做爰吃奶网站上海网站seo诊断
  • 网站建设师微信营销典型案例
  • 百度秒收网站重庆百度整站优化
  • 手机网站开发c正规seo关键词排名网络公司
  • 企业查询天眼seo关键词怎么选择
  • 网站建设报告书搜索引擎优化包括哪些
  • 广州站扩建站长之家seo查询官方网站
  • 静态网页制作代码htmlseo技术好的培训机构
  • wordpress文章自动发布功能福州seo技术培训
  • 免费网站的app外链交易平台
  • 做混剪素材下载网站怎么做手工
  • 企业网站能起到什么作用济南百度开户电话
  • 学校网站建设要求百度入口
  • 黄村专业网站建设公司生猪价格今日猪价
  • 怎么做阿里巴巴网站推广平台有哪些
  • 防城港网络推广seo建站
  • seo整站优化托管旅行网站排名
  • ajax网站模板小红书推广引流软件
  • 中国建设网站下载安装网站免费制作
  • 高端网站建设优化网页广告
  • asp.net网站发布到虚拟主机来宾seo
  • 有做学历在网站能查的到的网站降权查询工具
  • 制作网站商城关键词搜索指数查询工具
  • 如何提高网站访问量市场营销推广
  • 唯品会专门做特卖的网站廊坊百度快照优化哪家服务好
  • 网站建设优化推广一个新的app如何推广
  • 用jsp和mysql做网站合肥百度竞价推广代理公司