Spark的shuffle调优

上传:evo_lution 浏览: 49 推荐: 0 文件:RTF 大小:50.08KB 上传时间:2019-01-19 08:15:14 版权申诉
spark.reducer.maxSizeInFlight 48m reduce task的buffer缓冲,代表了每个reduce task每次能够拉取的map side数据最大大小,如果内存充足,可以考虑加大,从而减少网络传输次数,提升性能 spark.shuffle.blockTransferService netty shuffle过程中,传输数据的方式,两种选项,netty或nio,spark 1.2开始,默认就是netty,比较简单而且性能较高,spark 1.5开始nio就是过期的了,而且spark 1.6中会去除掉 spark.shuffle.compress true 是否对
上传资源
用户评论