去重算法Similarity

上传:wy_1618 浏览: 55 推荐: 0 文件:RAR 大小:15.35KB 上传时间:2018-12-21 10:14:43 版权申诉
实现了SimHash算法、MinHash算法、Shingling算法、汉明距离、Jaccard Index。供初学者参考
上传资源
用户评论

badminton50655 2018-12-21 10:14:43

算法比较全,但是实现比较简单

呵呵64194 2018-12-21 10:14:43

很好,解决了问题

prfk39127 2018-12-21 10:14:43

还是很不错的,可以好好看看学习一下~~

agentyao 2018-12-21 10:14:43

算法比较全,相似有对比,不错的学习资料、

weixin_34643709 2018-12-21 10:14:43

程序没问题,不过实现太基础,shingling只是取词比较没有生成摘要指纹,不适合用于实际项目参考

闪耀的星 2018-12-21 10:14:43

非常全面,有参考价值,值得研究,我可以借助他们用C实现

qqverification32203 2018-12-21 10:14:43

算法比较全,有何多计算similarity的算法,不错的资源。

happyachilles 2018-12-21 10:14:43

java写的,需要C++,自己琢磨改写吧,谢谢作者

icebaronlei 2018-12-21 10:14:43

算法比较全,有何多计算similarity的算法,不错的资源。

惊蛰ins 2018-12-21 10:14:43

算法比较全,测试例子还得琢磨一下才能明白