SparkStreaming:大规模流式数据处理的新贵
Spark Streaming是大规模流式数据处理的新贵,将流式计算分解成一系列短小的批处理作业。本文阐释了Spark Streaming的架构及编程模型,并结合实践对其核心技术进行了深入的剖析,给出了具体的应用场景及优化方案。提到SparkStreaming,我们不得不说一下BDAS(Berkeley DataAnalyticsStack),这个伯克利大学提出的关于数据分析的软件栈。从它的视角来看,目前的大数据处理可以分
用户评论