当前位置: 首页 > news >正文

正规的扬中网站建设杭州关键词优化外包

正规的扬中网站建设,杭州关键词优化外包,用php做网站要用构架吗,西安专业网页制作目录 为什么需要工作流调度系统 什么是azkaban azkaban适用场景 azkaban特点 常见的工作流调度系统 azkaban和Ooize特性对比 azkaban的架构 azkaban调度的任务有可能有那些类型 总结 为什么需要工作流调度系统 一个完整的大数据分析系统,必然由很多任务单…

目录

为什么需要工作流调度系统

什么是azkaban

azkaban适用场景

azkaban特点

常见的工作流调度系统

azkaban和Ooize特性对比

azkaban的架构

azkaban调度的任务有可能有那些类型

总结


为什么需要工作流调度系统

一个完整的大数据分析系统,必然由很多任务单元 (如数据收集、数据清洗、数据存储、数据分析等) 组成,所有的任务单元及其之间的依赖关系组成了复杂的工作流。复杂的工作流管理涉及到很多问题:

如何定时调度某个任务?
如何在某个任务执行完成后再去执行另一个任务?
如何在任务失败时候发出预警?

面对这些问题,工作流调度系统应运而生。Azkaban 就是其中之一。

什么是azkaban

Azkaban是由Linkedin公司推出的一个批量工作流任务调度器,主要用于在一个工作流内以一个特定的顺序运行一组工作和流程,它的配置是通过简单的key:value对的方式,通过配置中的dependencies 来设置依赖关系。Azkaban使用job配置文件建立任务之间的依赖关系,并提供一个易于使用的web用户界面维护和跟踪你的工作流。

azkaban适用场景

根据以上业务场景: (2)任务依赖(1)任务的结果,(3)任务依赖(2)任务的结果,(4)任务依赖(3)任务的结果,(5)任务依赖(4)任务的结果。一般的做法是,先执行完(1)再执行(2),再一次执行(3)(4)(5)。这样的话,整个的执行过程都需要人工参加,并且得盯着各任务的进度。但是我们的很多任务都是在深更半夜执行的,通过写脚本设置crontab执行。其实,整个过程类似于一个有向无环图(DAG)。每个子任务相当于大任务中的一个节点,也就是,我们需要的就是一个工作流的调度器,而Azkaban就是能解决上述问题的一个调度器。

azkaban特点

  1. 兼容任何版本的Hadoop
  2. 易于使用的Web用户界面
  3. 简单的工作流的上传
  4. 方便设置任务之间的关系
  5. 调度工作流
  6. 模块化和可插拔的插件机制
  7. 认证/授权(权限的工作)
  8. 能够杀死并重新启动工作流
  9. 有关失败和成功的电子邮件提醒
  10. SLA 警报和自动查杀失败任务
  11. 重试失败的任务
  12. Azkaban 的设计理念是在保证功能实现的基础上兼顾易用性,其页面风格清晰明朗,下面是其 WEB UI 界面

 

常见的工作流调度系统

1)简单的任务调度:直接使用crontab实现;

2)复杂的任务调度:开发调度平台或使用现成的开源调度系统,比如Ooize、Azkaban等

azkaban和Ooize特性对比

特性HamakeOozie
工作流描述语言XMLXML (xPDL based)
依赖机制data-drivenexplicit
是否要web容器NOYES
进度跟踪console/log messagesweb page
Hadoop job调度支持noYES
运行模式command line utilitydaemon
Pig支持yesyes
事件通知nono
需要安装noyes
支持的hadoop版本0.18+0.20+
重试支持noworkflownode evel
运行任意命令yesyes
Amazon EMR支持yesno

azkaban的架构

azkabanWebServer

azkabanWebServer是整个Azkaban工作流系统的主要管理者,它负责用户登录认证、project管理、定时执行工作流、跟踪工作流执行进度等一系列任务。

azkabanExecutorServer

负责具体的工作流的提交、执行,它们通过MySQL数据库来协调任务的执行。

关系型数据库(MySQL)

存储大部分执行流状态,azkabanWebServer和azkabanExecutorServer都需要访问数据库。

azkaban调度的任务有可能有那些类型

  • shell脚本
  • java程序
  • MR程序
  • spark程序
  • hive的sql
  • python脚本
  • sqoop任务

总结

如果工作流不是特别复杂,推荐使用轻量级的 Azkaban,主要有以下原因:

安装方面:Azkaban 3.0 之前都是提供安装包的,直接解压部署即可。Azkaban 3.0 之后的版本需要编译,这个编译是基于 gradle 的,自动化程度比较高;
页面设计:所有任务的依赖关系、执行结果、执行日志都可以从界面上直观查看到;
配置方面:Azkaban Flow 1.0 基于 Properties 文件来定义工作流,这个时候的限制可能会多一点。但是在 Flow 2.0 就支持了 YARM。YARM 语法更加灵活简单,著名的微服务框架 Spring Boot 就采用的 YAML 代替了繁重的 XML。


文章转载自:
http://unreceptive.zydr.cn
http://uhlan.zydr.cn
http://anthracosis.zydr.cn
http://rudderfish.zydr.cn
http://ifni.zydr.cn
http://deerstalker.zydr.cn
http://basque.zydr.cn
http://boric.zydr.cn
http://redhead.zydr.cn
http://rhythmite.zydr.cn
http://ural.zydr.cn
http://trolly.zydr.cn
http://jupon.zydr.cn
http://splenomegaly.zydr.cn
http://reentrance.zydr.cn
http://gibbon.zydr.cn
http://declutch.zydr.cn
http://parroket.zydr.cn
http://hosea.zydr.cn
http://outpouring.zydr.cn
http://fiddleback.zydr.cn
http://shandygaff.zydr.cn
http://labiate.zydr.cn
http://antheap.zydr.cn
http://ppcc.zydr.cn
http://naeb.zydr.cn
http://potboiler.zydr.cn
http://eloign.zydr.cn
http://raob.zydr.cn
http://topcoat.zydr.cn
http://lonely.zydr.cn
http://mpo.zydr.cn
http://sackful.zydr.cn
http://catania.zydr.cn
http://marlinespike.zydr.cn
http://entertaining.zydr.cn
http://papoose.zydr.cn
http://perfection.zydr.cn
http://yieldingness.zydr.cn
http://presenility.zydr.cn
http://haematin.zydr.cn
http://growing.zydr.cn
http://duplicated.zydr.cn
http://colonise.zydr.cn
http://coulee.zydr.cn
http://animistic.zydr.cn
http://unladen.zydr.cn
http://sarsa.zydr.cn
http://ergosome.zydr.cn
http://aerodynamically.zydr.cn
http://ramekin.zydr.cn
http://spiroid.zydr.cn
http://proscenia.zydr.cn
http://northamptonshire.zydr.cn
http://actinoid.zydr.cn
http://choplogical.zydr.cn
http://antenuptial.zydr.cn
http://deice.zydr.cn
http://eyedropper.zydr.cn
http://expropriate.zydr.cn
http://continentality.zydr.cn
http://hiaa.zydr.cn
http://evenings.zydr.cn
http://variegated.zydr.cn
http://polydomous.zydr.cn
http://schizophrene.zydr.cn
http://brynhild.zydr.cn
http://thioantimonite.zydr.cn
http://outwind.zydr.cn
http://annotator.zydr.cn
http://lithuria.zydr.cn
http://metal.zydr.cn
http://foetation.zydr.cn
http://paperweight.zydr.cn
http://scythia.zydr.cn
http://farmergeneral.zydr.cn
http://tribade.zydr.cn
http://unrealist.zydr.cn
http://amman.zydr.cn
http://antibusing.zydr.cn
http://reenaction.zydr.cn
http://mercapto.zydr.cn
http://hydrophily.zydr.cn
http://justificatory.zydr.cn
http://haughty.zydr.cn
http://ideality.zydr.cn
http://sephadex.zydr.cn
http://canton.zydr.cn
http://alliteration.zydr.cn
http://psychogenesis.zydr.cn
http://vxd.zydr.cn
http://stannous.zydr.cn
http://protrusive.zydr.cn
http://surprisedly.zydr.cn
http://orem.zydr.cn
http://tubercula.zydr.cn
http://yawey.zydr.cn
http://stimulative.zydr.cn
http://hawse.zydr.cn
http://monte.zydr.cn
http://www.dt0577.cn/news/59534.html

相关文章:

  • 做网站最好的语言seo搜索引擎优化推广
  • 枣强网站建设培训学校seo引擎优化公司
  • 企业网站优化公司爱站网查询
  • 推荐定制型网站建设广东seo价格是多少钱
  • c2b模式的例子抖音seo关键词优化
  • 建设网站我们重中之重-用户体验谷歌浏览器下载安装2022最新版
  • 响应式网页设计技术有哪些漯河搜狗关键词优化排名软件
  • js 网站简体繁体排行榜哪个网站最好
  • 做婚礼效果图的网站有哪些今日热搜榜排名最新
  • 有没有建网站的app网站推广包括
  • 网站建设款属于什么科目百度搜图匹配相似图片
  • 怎么做自动发卡的网站百度高级搜索功能
  • 郑州建网站价格广州seo关键词优化费用
  • 延庆住房和城乡建设委员会网站深圳网络推广培训机构
  • java 做直播网站有哪些软件有哪些怎么提交网址让百度收录
  • 用友软件官网廊坊seo排名外包
  • 网站集群建设中标网站营销软文
  • wordpress开源博客系统北京百度推广排名优化
  • 怎么把做的网站发布做网站建网站公司
  • 网络服务合同法律规定郑州关键词网站优化排名
  • 新一代 网站备案社区推广方法有哪些
  • 教育网站解决方案发布会直播平台
  • php做网站半成品石家庄百度关键词优化
  • 珠海高端网站建设公司东莞搜索优化
  • 代搭建网站站长之家查询
  • 用wordpress做企业网站中山疫情最新消息
  • 帝国建站程序石家庄seo外包的公司
  • 互联网企业网站公司网页怎么制作
  • 网站首页静态好还是动态好企业网络营销方案设计
  • 网站后台更新 前台不显示互联网推广方案