1。工作流调度器的介绍
(1)为什么要使用工作流调度器?
? ?——一个完整的数据分析系统通常都是由大量任务单元组成:shell脚本程序,java程序,mapreduce程序,蜂巢脚本等
? ?——各任务单元之间存在时间先后及前后依赖关系
? ?——为了很好地组织起这样的复杂执行计划,需要一个工作流调度系统来调度执行
(2)常见工作流调度器
? ?在hadoop领域,常见的工作流调度器有Oozie,阿兹卡班,层叠,Hamake等。
阿兹卡班的部署以及简单使用
? ?——一个完整的数据分析系统通常都是由大量任务单元组成:shell脚本程序,java程序,mapreduce程序,蜂巢脚本等
? ?——各任务单元之间存在时间先后及前后依赖关系
? ?——为了很好地组织起这样的复杂执行计划,需要一个工作流调度系统来调度执行
? ?在hadoop领域,常见的工作流调度器有Oozie,阿兹卡班,层叠,Hamake等。
阿兹卡班的部署以及简单使用