论文研究一种基于熵的文本相似性计算方法.pdf

上传:Xieminsen 浏览: 38 推荐: 0 文件:PDF 大小:1.05MB 上传时间:2019-09-18 02:20:08 版权申诉
文本比较是求解两个文本间相似度的过程,文本间的相似度越高代表两个文本越趋于类似。传统的相似度算法主要从字符的角度度量文本的相似性,忽略了文本内多个共同文本串对于文本相似度的影响。针对此问题提出一种基于熵的相似度求解方法,在对文本间字符信息的提取基础上,建立共同子文本串度量维度,然后采用熵的方法进行相似度度量。实验表明,该方法具有更平滑的相似度曲线,从而验证了算法的有效性和准确性。
上传资源
用户评论