基于云计算平台Hadoop的并行k_means聚类算法设计研究_赵卫中.pdf

上传:weixin_53320327 浏览: 9 推荐: 0 文件:PDF 大小:347.77KB 上传时间:2021-05-05 05:53:03 版权申诉
随着数据库技术的发展和Internet的迅速普及,实际应用中需要处理的数据量急剧地增长,致聚类研究面临许多新的问题和挑战,如海量数据和新的计算环境等。深入研究了基于云计算平台Hadoop的并行k-means聚类算法,给出了算法设计的方法和策略。在多个不同大小数据集上的实验表明,设计的并行聚类算法具有优良的加速比、扩展率和数据伸缩率等性能,适合用于海量数据的分析和挖掘。
上传资源
用户评论
相关推荐
基于计算并行算法研究
主要介绍了现在比较流行的云计算平台,以及如何在云计算平台上实现并行聚类
其他文档
0B
2019-05-13 13:49
基于并行遗传算法K_means研究
基于并行遗传算法的K_means聚类研究(论文)。
PDF
0B
2019-06-05 09:46
计算平台Canopy_Kmeans并行算法研究_孙秀娟.pdf
针对大数据的高维特性及海量性,提出云计算平台中的Canopy-Kmeans并行聚类算法,通过三角不等式原理,能够使计算冗余降低,使算法执行速度得到提高。对Canopy-Kmeans并行聚类算法进行深入
PDF
1.62MB
2021-04-19 04:45
基于k_means算法研究.doc
收稿日期:20101201;修回日期:20110302基金项目:哈尔滨市后备带头人基金项目(2004AFXXJ039作者简介:黄 韬(1982,男,黑龙江人,硕士研究生,研究方向为 企业智能计算;刘胜
DOC
88KB
2020-12-16 10:38
基于hadoop平台算法实现.ppt
A NLE a ADOOP 宣讲人:李小龙彭健辛张顺王岳李杰 背景介绍 云计算 是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息 以按需求提供给计算机和其他设备,云是网络互联网的一种比
PPT
10.53MB
2020-12-16 04:51
K_means算法研究
K-means是一种数据挖掘的聚类算法 其优点突出明显 广泛应用于入侵检测。
CAJ
0B
2018-12-31 16:31
个性化服务并行K_Means算法
个性化服务中的并行K-Means聚类算法 Knn :K-Means A类算法在墓于Web日志的个性化服务领域得到广泛的应用,但是在处理海I戮据过程中, 传统的(单机)K-Means聚类算法存在着可扩展
PDF
0B
2019-02-23 14:50
Hadoop平台基于粗糙集K Modes算法.pdf
中国科技论文在线 Rough Set based K-Modes Clustering Algorithm with Hadoop Cloud Platform# * 5 ZHANG Lisheng,
PDF
597KB
2020-12-16 04:09
k_means算法MapReduce并行化实现
利用k_means聚类算法的MapReduce并行化实现,为学习hadoop的同学提供参考
PDF
0B
2019-05-27 13:24
基于计算平台Hadoop神经网络算法研究与实现_刘珊珊
基于云计算平台Hadoop的聚类神经网络算法的研究与实现,设计云计算、大数据、神经网络
其他文档
0B
2019-05-13 13:49
论文研究基于并行模糊蚂蚁算法研究.pdf
基于并行模糊蚂蚁的聚类算法研究,冯周,张扬,本文提出了一种基于并行模糊蚂蚁的数据聚类算法。该算法使用蚂蚁群体优化原理及基于IF-THEN规则的Mamdani模糊推理系统找到优化的数据�
PDF
0B
2019-09-20 01:35
论文研究基于MapReduceACOKmeans并行算法.pdf
针对K-means算法处理海量数据存在严重的内存不足,提出利用MapReduce并行化K-means,但是普通的K均值存在收敛速度慢、易陷入局部最优和对初始聚类中心的选取等局限性,因此选择了经ACO改
PDF
0B
2020-01-03 17:07
论文研究基于MapReduce并行SFLAFCM算法.pdf
模糊C均值算法(FuzzyC-Means,FCM)是目前应用比较广泛的一种聚类算法。FCM算法的聚类质量依赖于初始聚类中心的选择并且易陷入局部极值,结合混合蛙跳算法(ShuffledFrogLeapi
PDF
0B
2020-05-19 08:06
论文研究基于Hadoop平台并行特征匹配算法研究.pdf
很多大企业采用Hadoop分布式文件系统来存储海量数据,而传统的病毒扫描主要针对单机系统环境。研究如何并行化病毒扫描中的核心特征匹配算法来处理分布式海量数据。在Hadoop平台下,基于MapReduc
PDF
0B
2019-09-06 06:38
基于K_Means文本层次算法研究
k-means算法接受参数k;然后将事先输入的n个数据对象划分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个
其他文档
0B
2019-09-03 10:02