维基百科中文语料word2vec训练后结果
中文维基百科语料库,将其转换为文本文件后,进行繁体字转换为简体字,字符集转换,分词,然后训练得到模型以及向量。由于文件上传的大小限制是60MB,而训练后的所有文件大小有1G以上,所以这里只提供了下载链接,地址在网盘中。使用python中的gensim包进行训练得到的,运行时间较长,纯粹的维基百科中文语料训练后的结果,拿去可以直接使用。
用户评论
djk48179 2019-07-11 05:44:26
您说可以看您博客,但是我找了一下却没有看到呀,您能发下链接吗 不发这资源就是白下的了 另外 还特别想要您处理后的中文语料 就是没有经过分词的 您如果还有 方便的话麻烦您也给我发一份
wliud 2019-07-11 05:44:26
可以的模型
U_K_D 2019-07-11 05:44:26
还没使用。。等下试试
qq_72555 2019-07-11 05:44:26
请问一下四个文件分别是什么用处啊?
qweqwee9 2019-07-11 05:44:26
你不是说这是训练后的模型吗,就是因为自己训练内存溢出才来下你的资源的呀o(╥﹏╥)o
hnhychenhui 2019-07-11 05:44:26
非常好方法
laughter6183 2019-07-11 05:44:26
我下载了,只有一个URL,不知道怎么用
hygiene_23009 2019-07-11 05:44:26
介绍一下各个文件使用方法更好了,还是感谢
qq_80331 2019-07-11 05:44:26
刚好在学习 Gensim 谢谢!