(版本定制)第2课:通过案例对SparkStreaming透彻理解之二 - 行业资讯

本期内容:

1解密火花流运行机制

2解密火花流架构

一切不能进行实时流处理的数据都是无效的数据。在流处理时代,SparkStreaming有着强大吸引力,而且发展前景广阔,加之火花的生态系统,流可以方便调用其他的诸如SQL, MLlib等强大框架,它必将一统天下。

火花流运行时与其说是火花核心上的一个流式处理框架,不如说是火花核心上的一个最复杂的应用程序。如果可以掌握火花流这个复杂的应用程序,那么其他的再复杂的应用程序都不在话下了。这里选择火花流作为版本定制的切入点也是大势所趋。

从这里可以看的出,DStream就是火花流的核心,就想火花核心的核心是抽样,它也有依赖和计算。更为关键的是下面的代码: