论文研究 一种新的无监督连续属性离散化方法.pdf

上传:zzhhrz 浏览: 20 推荐: 0 文件:PDF 大小:503.45KB 上传时间:2020-07-17 17:37:27 版权申诉
提出了一种基于聚类方法的无监督连续属性离散化算法,称为CAMNA(Clustering and Merging on Numerical Attribute)算法。CAMNA算法通过聚类过程将数值值域划分为多个离散区间,根据类分布的指导信息优化合并相邻区间,实现理想的离散方案。通过实验证明该算法在保持执行效率较高的前提下,离散结果更加合理,生成的决策树结构简单,获得较少的分类规则,分类准确率也有提高。

论文研究 一种新的无监督连续属性离散化方法.pdf

上传资源
用户评论
相关推荐
论文研究一种基于连续属性离散属性约简方法.pdf
通过将连续属性离散化和属性约简结合起来,首先对连续型的属性列进行离散化,得到新的决策表;然后再对新的决策表作属性约简,解决了属性约简过程中由于不考虑连续属性而无法求出准确约简属性的问题。最后通过具体案
PDF
0B
2019-07-25 15:44
论文研究连续属性离散MaxDiff方法.pdf
粗糙集理论用于数据挖掘要求连续数据离散化,在分析目前的离散化算法的基础上,提出了一种局部离散化方法,以期降低断点、规则数量。使用此算法在模拟电路故障数据上进行的试验,表明其性能较好。
PDF
830KB
2020-07-17 05:36
论文研究基于对象分布连续属性离散方法.pdf
为了利用信息系统对象在数据空间中分布,通过对对象的模糊聚类,计算每一类在坐标轴上的统计值。利用正态概率分布特性,引入重叠度和空隙度选取合适的概率,确定最优的区间端点,实现连续属性离散化。
PDF
196KB
2020-07-18 17:43
论文研究.连续属性离散算法比较研究.pdf
探讨了贪心及其改进算法、基于属性重要性、基于信息熵和基于聚类四类连续属性离散化算法,并通过实验验证这四类算法的离散化效果。实验结果表明,数据集离散化的效果不仅取决于使用算法,而且与数据集连续属性的分布
PDF
158KB
2021-04-17 13:50
连续型变量离散_监督监督原理
斯坦福大学连续型变量的监督与无监督离散化,英文原版论文
PDF
0B
2019-04-28 01:00
论文研究一种连续属性值域划分离散方法.pdf
提出一种连续属性值域划分的离散化新方法,该方法定义一个新的离散化函数,依据类与属性之间的相互依赖关系选择最优的离散区间列表;此外,采用变精度粗糙集理论合理地控制数据离散化产生的信息丢失,减少分类错误。
PDF
0B
2020-06-07 18:08
论文研究一种基于粗糙集理论连续属性离散算法.pdf
粗糙集理论中要求离散化保持原有决策系统的不可分辨关系,但以往的一些算法在离散过程中会使近似精度控制在可以接受的范围,即允许一定的错分。针对此不足,在保证决策属性绝对不改变的情况下,提出一种新的区间拆分
PDF
0B
2019-09-26 09:39
论文研究基于词出现和信息增益连续属性离散方法.pdf
连续属性的离散化是文本分类任务中数据预处理阶段的一项重要技术。针对机器学习领域中的诸多优秀算法只能处理离散属性的特点,提出一种基于词出现和信息增益相结合的多区间连续属性离散化方法(multi-inte
PDF
583KB
2020-07-17 17:37
论文研究信息偏差在连续属性离散应用.pdf
研究了一种有效的词典驱动的联机手写日文病名识别方法。病名词典以树结构存储,包含21 713个病名短语。在切分中,手写病名字符串通过分析相邻笔划之间的空间信息等特征被切分为原始的片段序列。连续的片段动态
.PDF
492KB
2020-07-20 01:23
一种用于连续属性离散约简算法
针对在 Ng uy en 和 Skow r on 的离散化算法中进行启发式约简时会出现某些属性不能进行离散 化问题,以及在无核数据集中启发式约简算法计算量比较大等问题,在粗糙集理论和属性频率函数的基
PDF
203KB
2021-02-22 06:57
RoughSet中基于聚类连续属性离散方法.pdf
分析了一些中连续属性离散化的方法,指出了其中的某些不足,并给出了一个基于聚类的连续属性离散化的方法。对当前RoughSet的论域中的例子根据相似性进行聚类,对每个聚类在各属性轴上的投影的边界设离散断点
pdf文档
0B
2019-06-01 08:27
论文研究决策连续形式背景可视数据离散方法.pdf
连续形式背景离散化是形式概念分析领域重要的基础问题之一。针对形式背景离散化的特殊要求,提出了一种可视化的数据离散化方法。该方法借助可视化方法对数据类别分布进行表示,将连续数据分布转换为图形分布,进一步
PDF
0B
2019-09-02 22:40
论文研究基于最近邻聚类属性离散算法.pdf
训练人工神经网络的目的是调整各层的权重系数以达到最优,因而训练过程的实质是一项优化任务。传统的训练算法存在着容易陷入局部最优、计算复杂等缺陷。介绍一种训练前馈神经网络的蜜蜂群优化算法,它是一种简单、鲁
PDF
0B
2020-04-22 18:19
粗糙集连续属性离散k均值方法
为在应用粗糙集理论处理数据时,对连续属性进行离散化预处理,采用k均值算法对连续属性进行离散化的方法,将属性无监督聚类成两类.通过在UCI数据库上选取的4组数据进行实验,首先离散化,再通过粗糙集约简,最
PDF
613KB
2020-08-12 10:33
论文研究基于改进粒子群优化粗糙集连续属性离散.pdf
信号传播过程中因障碍物阻挡产生的阴影衰落对无线传感器网络的覆盖产生较大的影响。针对无线传感器网络的完全覆盖问题,基于自由空间环境下的规则部署方式,推导出在衰落阴影环境下,完全覆盖网络监测区域所需的最少
PDF
0B
2020-04-25 06:18