云计算平台上的Canopy_Kmeans并行聚类算法研究_孙秀娟.pdf

上传:weixin_53320327 浏览: 7 推荐: 0 文件:PDF 大小:1.62MB 上传时间:2021-04-19 04:45:55 版权申诉
针对大数据的高维特性及海量性,提出云计算平台中的Canopy-Kmeans并行聚类算法,通过三角不等式原理,能够使计算冗余降低,使算法执行速度得到提高。对Canopy-Kmeans并行聚类算法进行深入的研究,并且在大量不同大小数据集中的实验结果表明,所设计的并行聚类算法具有良好的加速比、数据伸缩率及扩展率等特点,能够在海量数据挖掘及分析中使用。
上传资源
用户评论