Spark SourceCode Analysis:Apache Spark笔记本 spark source code

上传:partly73861 浏览: 21 推荐: 0 文件:ZIP 大小:104.33KB 上传时间:2021-04-07 15:28:11 版权申诉
Spark-SourceCode分析 Apache Spark笔记本作者:祁传宏军 Spark简介 Spark起源自科研院所,加州大学伯克利分校UC Berkeley的AMP实验室。该校在edx上开设了系列课程:)“使用Spark XSeries进行数据科学与工程”。 08,09年起,一说到大数据,大家就想到Hadoop。但是这两年,Spark迅猛发展。 Spark是Hadoop生态圈的一环。Spark是一种计算框架,16年开始爆发,现在已经基本取代了Hadoop中的Map Reduce。 计算框架:Spark是一种计算框架,没有资源调度,数据存储等功能。需要和生态圈内的其他框架配合使用。 内存计算:Hadoop中本机的Map Reduce是基于磁盘的,对于需要反复重复的算法,中间结果重复转移插入磁盘,产生大量的I / O和序列化/反序列化堆积。而Spark的核心Spark Core在内
上传资源
用户评论