基于Bootstrapping的文本分类模型

上传:srxljl 浏览: 15 推荐: 0 文件:PDF 大小:334.83KB 上传时间:2020-08-05 02:19:49 版权申诉
文中提出一种基于Bootstrapping 的文本分类模型,该模型采用最大熵模型作为分类器,从少量的种子集出发,自动学习更多的文本作为新的种子样本,这样不断学习来提高最大熵分类器的文本分类性能。文中提出一个权重因子来调整新的种子样本在分类器训练过程中的权重。实验结果表明,在相同的手工训练语料的条件下,与传统的文本分类模型相比这种基于Bootstrapping 的文本分类模型具有明显优势。
上传资源
用户评论
相关推荐
基于卷积递归模型文本分类研究
近年来卷积神经网络和循环神经网络在文本分类领域得到了越来越广泛的的应用。提出一种卷积神经网络和长短时记忆网络特征融合的模型,通过长短期记忆网络作为池化层的替代来获得长期依赖性,从而构建一个联合CNN和
PDF
391KB
2020-11-06 19:29
基于扩展Petri网文本分类模型
文本介绍了基于扩展Petri网的文本分类模型的设计和实现,很实用
PDF
115KB
2021-04-26 10:02
基于JST模型新闻文本情感分类研究
基于JST 模型的新闻文本的情感分类研究
PDF
218KB
2021-02-09 12:27
基于LDA主题模型文本分类方法
针对短文本的特征稀疏性和上下文依赖性两个问题,提出一种基于隐含狄列克雷分配模型的短文本分类方法。利用模型生成的主题,一方面区分相同词的上下,降低权重;另一方面关联不同词以减少稀疏性,增加权重。
PDF
0B
2019-05-28 06:40
基于N元语言模型文本分类方法
基于N元语言模型的文本分类方法.pdf 汉语n元模型统计软件.ppt 基于N元语法的汉语自动分词系统研究.pdf 一种基于N元语法分布的语言模型自适应方法.pdf 语言模型的基本概念.doc N元语言
RAR
0B
2019-01-01 17:40
基于BERT模型科技政策文本分类研究
本文主要针对科技政策文本分类进行研究,采用了基于BERT模型的方法。通过对科技政策文本的特征进行提取和分析,利用BERT模型进行分类预测,实现了对科技政策文本的自动分类。研究结果表明,基于BERT模型
pdf
1.45MB
2023-07-22 18:30
LDA文本分类模型
基于语义模型的场景建模算法常常会关注模型中的参数与视频中的信息的对应关系,一般来说,模型里相对重要的参数都有其特有的意义(对应视频中的一个事件或者是主题概率等)。LDA(Latent Dirichle
pdf
0B
2019-04-14 23:50
基于VSM模型动态文本分类设计
介绍了基于VSM模型动态文本分类器的设计和实现。
KDH
0B
2019-08-01 06:12
基于BootStrapping集成分类中文观点句识别方法
领域相关的大规模和高质量的标注训练数据是分类器性能的重要保证,而标注训练语料是一件费时费力的工作。该文提出了一种采用小规模标注语料识别中文观点句的方法。首先采用Bootstrapping方法扩展训练语
PDF
1.06MB
2021-02-23 15:59
文本分类模型Pytorch在Pytorch中实现最新文本分类模型源码
文本分类模型 在Pytorch中实现最新的文本分类模型 实施模型 fastText:fastText模型, TextCNN:提出的用于文本分类的CNN TextRNN:用于文本分类的双向LSTM网络
ZIP
12.48MB
2021-02-10 01:31
Python用于长文本分类各种基线模型文本分类
allkindsofbaselinemodelsforlongtextclassificaiton(textcategorization)
ZIP
0B
2020-06-08 17:30
论文研究基于隐Markov模型文本分类.pdf
解码器是统计机器翻译研究的关键部分。在基于短语的统计机器翻译的基础上,结合对数线性模型的思想加入多个特征模型,研究了一种动态规划的柱搜索解码算法。详细介绍此算法在解码器中的具体实现,并对翻译速度和精度
PDF
0B
2019-09-24 00:45
论文研究基于LDAwSVM模型文本分类研究.pdf
SVM分类算法处理高维数据具有较大优势,但其未考虑语义的相似性度量问题,而LDA主题模型可以解决传统的文本分类中相似性度量和主题单一性问题。为了充分结合SVM和LDA算法的优势并提高分类精确度,提出了
PDF
0B
2019-09-24 00:45
论文研究基于文本分类信息检索模型.pdf
基于文本分类的信息检索模型,丁志刚,王小捷,本文探索了如何利用信息文本分类对检索系统结果进行改善。首先,根据特定的分类集分别对待检索文档和检索条件进行数据建模;讨论
PDF
0B
2019-09-24 00:45
论文研究基于LDA模型文本分类研究.pdf
在传统模糊C-均值聚类算法的基础上,提出了一种新型区间值数据模糊聚类算法。运用区间分割策略改进了区间距离的计算公式,成功解决了区间距离计算方法存在的缺陷。提出了区间值数据模糊聚类的数学模型,并拓广模糊
PDF
0B
2020-02-13 04:17