论文研究基于LDAwSVM模型的文本分类研究.pdf

上传:xin9707635 浏览: 39 推荐: 0 文件:PDF 大小:1.02MB 上传时间:2019-09-24 00:45:45 版权申诉
SVM分类算法处理高维数据具有较大优势,但其未考虑语义的相似性度量问题,而LDA主题模型可以解决传统的文本分类中相似性度量和主题单一性问题。为了充分结合SVM和LDA算法的优势并提高分类精确度,提出了一种新的LDA-wSVM高效分类算法模型。利用LDA主题模型进行建模和特征选择,确定主题数和隐主题—文本矩阵;在经典权重计算方法上作改进,考虑各特征项与类别的关联度,设计了一种新的权重计算方法;在特征词空间上使用这种基于权重计算的wSVM分类器进行分类。实验基于R软件平台对搜狗实验室的新闻文本集进行分类,得到了宏平均值为0.943的高精确度分类结果。实验结果表明,提出的LDA-wSVM模型在文本自动分类中具有很好的优越性能。
上传资源
用户评论
相关推荐
论文研究基于LDA模型文本分类研究.pdf
在传统模糊C-均值聚类算法的基础上,提出了一种新型区间值数据模糊聚类算法。运用区间分割策略改进了区间距离的计算公式,成功解决了区间距离计算方法存在的缺陷。提出了区间值数据模糊聚类的数学模型,并拓广模糊
PDF
0B
2020-02-13 04:17
论文研究基于隐Markov模型文本分类.pdf
解码器是统计机器翻译研究的关键部分。在基于短语的统计机器翻译的基础上,结合对数线性模型的思想加入多个特征模型,研究了一种动态规划的柱搜索解码算法。详细介绍此算法在解码器中的具体实现,并对翻译速度和精度
PDF
0B
2019-09-24 00:45
论文研究基于文本分类信息检索模型.pdf
基于文本分类的信息检索模型,丁志刚,王小捷,本文探索了如何利用信息文本分类对检索系统结果进行改善。首先,根据特定的分类集分别对待检索文档和检索条件进行数据建模;讨论
PDF
0B
2019-09-24 00:45
论文研究基于PSO ICA文本分类研究.pdf
文本分类在采用向量空间模型(VSM)表达文本特征时,容易出现特征向量高维且稀疏的现象,为了对原始的文本特征向量进行有效简化,提出了一种基于粒子群(PSO)优化独立分量分析(ICA)进行降维的方法,并将
PDF
555KB
2020-07-17 01:03
论文研究基于VSM和LDA模型结合文本分类.pdf
基于VSM和LDA模型结合的文本分类,王海江,刘晓鸿,自动文本分类是一种管理和利用海量文本数字信息的有效手段。在当今数字文本信息越来越繁杂的情况下,文本分类技术的应用越来越广
PDF
0B
2019-09-06 13:44
论文研究基于fcmpCNN模型网络文本情感多分类标注.pdf
针对网络文本情感分析,提出了一种基于全卷积—多池化单元的卷积神经网络模型,实现情感多分类标注。无须手动指定多种上下文窗口大小和尽量保留文本的多层次语义,模型通过堆叠多级全卷积—多池化单元,提取出文本特
PDF
1.11MB
2020-07-17 11:38
论文研究基于粗糙集文本分类研究.pdf
基于粗糙集的文本分类研究,徐欣,黄理灿,文本分类是信息检索和数据挖掘等领域的研究热点。在现有的一些文本分类方法中,文本都是基于向量空间模型表示的,所形成的特征空
PDF
0B
2019-09-21 20:10
论文研究基于依存句法关系文本情感分类研究.pdf
为增加向量空间模型的文本语义信息,提出三元组依存关系特征构建方法,将此方法用于文本情感分类任务中。三元组依存关系特征构建方法在得到完整依存解析树的基础上,先依据中文语法特点,制定相应规则对原有完整树进
PDF
545KB
2020-07-17 08:05
论文研究基于语义新闻文本分类.pdf
基于语义的新闻文本分类,赵一超,郭军,文本分类,是自然语言处理中的一个重要领域,经过长时间发展已经形成例如朴素贝叶斯、最大熵、SVM(支持向量机)等技术。语义作为
PDF
0B
2019-09-10 08:47
论文研究CNNELM混合短文本分类模型.pdf
针对目前自然语言处理研究中,使用卷积神经网络(CNN)进行短文本分类任务时可以结合不同神经网络结构与分类算法以提高分类性能的问题,提出了一种结合卷积神经网络与极速学习机的CNN-ELM混合短文本分类模
PDF
0B
2019-09-14 15:02
论文研究基于隶属度限幅特征VSM文本分类模型.pdf
通过文档基于模糊限定词的特征表达,定义特征的模糊函数,将文档表示为隶属度限幅的特征向量,构造文本集隶属度限幅的类特征矩阵,将每一类文本集映射为类期望向量,所有类期望向量便构成了隶属度限幅的特征VSM。
PDF
0B
2019-09-20 07:12
论文研究基于发现特征子空间模型文本分类算法.pdf
在非结构化数据挖掘结构模型,即发现特征子空间模型(DFSSM)的运行机制下,提出了一种新的文本分类算法——基于DFSSM的文本分类(TCDFSSM)算法。该算法在文本训练及分类阶段的基础上增加了自动反
PDF
0B
2019-09-28 20:58
基于卷积递归模型文本分类研究
近年来卷积神经网络和循环神经网络在文本分类领域得到了越来越广泛的的应用。提出一种卷积神经网络和长短时记忆网络特征融合的模型,通过长短期记忆网络作为池化层的替代来获得长期依赖性,从而构建一个联合CNN和
PDF
391KB
2020-11-06 19:29
论文研究基于用户分类隐含因子模型研究.pdf
针对现有隐含因子模型存在的新用户冷启动问题,提出基于用户分类的隐含因子模型,将用户分类信息融入到隐含因子的矩阵分解当中。先在原评分矩阵和用户分类信息的基础上使用指示函数和数据归一化等方法构建一个分类评
PDF
844KB
2020-07-24 02:53
论文研究基于混沌微粒群算法文本分类研究.pdf
针对中文文本分类问题,将其用于分类规则的抽取。为了避免微粒群算法在全局优化中陷入局部极值,利用混沌运动遍历性、随机性等特点,对标准微粒群算法进行了改进,提出了基于混沌微粒群算法的文本自动分类方法。仿真
PDF
0B
2019-08-13 23:15