scibert:科学文本的BERT模型 源码

上传:familiarise_41126 浏览: 122 推荐: 0 文件:ZIP 大小:27.22MB 上传时间:2021-02-07 21:18:56 版权申诉
SciBERT SciBERT是经过科学文字训练的BERT模型。 SciBERT受过SciBERT )的论文训练。 语料库大小为114万张论文,3.1B令牌。 我们在培训中使用论文的全文,而不仅仅是摘要。 SciBERT拥有自己的词汇表( scivocab ),该词汇表最适合于训练语料库。 我们训练了有壳和无壳版本。 我们还包括在原始BERT词汇表( basevocab )上训练的模型,以进行比较。 它可在各种科学领域的nlp任务上实现最先进的性能。 评估的详细信息在。 评估代码和数据包含在此仓库中。 下载训练有素的模型 更新! 现在可以直接在allenai组织下的allenai框架内
上传资源
用户评论
相关推荐
bert_score文本生成BERT分数源码
BERTScore 论文(ICLR 2020)中介绍了自动评估指标。 新闻: 更新至版本0.3.7 与Huggingface的变压器版本> = 4.0.0兼容。 感谢公共贡献者( , , )。
ZIP
956KB
2021-02-07 21:18
bert TensorFlow代码和BERT预训练模型源码
伯特 ***** 2020年3月11日新产品:更小的BERT模型***** 此版本发行了24个较小的BERT模型(仅限英语,无大小写,使用WordPiece掩码进行了培训),在读物精通的 。 我们已经
ZIP
106KB
2021-02-07 21:19
bert sklearn Google BERT模型sklearn包装器源码
scikit-learn包装器对BERT进行微调 一个scikit-learning包装器,可基于端口模型,以执行文本和令牌序列任务。 包括可配置的MLP作为文本和文本对任务的最终分类器/回归器 包括
ZIP
572KB
2021-04-01 15:28
基于BERT模型科技政策文本分类研究
本文主要针对科技政策文本分类进行研究,采用了基于BERT模型的方法。通过对科技政策文本的特征进行提取和分析,利用BERT模型进行分类预测,实现了对科技政策文本的自动分类。研究结果表明,基于BERT模型
pdf
1.45MB
2023-07-22 18:30
BERT中文文本分类pytorch此存储库包含用于文本分类预训练BERT模型PyTorch实现源码
PyTorch的BERT中文文本分类 此存储库包含用于中文文本分类的预训练BERT模型的PyTorch实现。 代码结构 在项目的根目录,您将看到: ├── pybert | └── callback
ZIP
46KB
2021-04-27 12:56
indic bert基于BERT印度语言多语言模型源码
印度文 | 印度伯特(Indic bert)是一种多语言ALBERT模型,专门涵盖12种主要印度语言。 它在我们约90亿个代币的新颖语料库上进行了预训练,并在一​​系列多样化的任务上进行了评估。 与其
ZIP
336KB
2021-02-17 10:36
KBQA BERT基于知识图谱QA系统BERT模型源码
KBQA-BERT 基于知识图谱的QA系统,BERT模型需要下载BERT预训练模型(中文)chinese_L-12_H-768_A-12 解压缩后放在./ModelParams文件夹里面(注意整个ch
ZIP
5.79MB
2021-04-04 12:25
基于BERT模型网络文本心理特质预测研究
本文针对网络文本心理特质预测问题,基于BERT模型进行了深入探究。通过对网络文本中包含的心理特质进行预测分析,可以更好地了解用户的心理状态和需求。具体而言,本研究将BERT模型应用于网络文本心理特质预
pdf
3.57MB
2023-07-22 19:11
BERT模型工程
google 最新推出的BERT模型工程代码,在11个NLP数据集上达到最优效果
ZIP
81KB
2020-07-17 02:51
KR BERT基于KoReanBERT预训练模型KR BERT用于Tensorflow和PyTorch源码
基于KoRean的Bert预先培训(KR-BERT) 这是首尔国立大学计算语言实验室开发的韩语专用,小规模BERT模型的发布,其性能可比或更高,并在引用。 词汇,参数和数据 多语言BERT (谷歌)
ZIP
33.61MB
2021-03-12 01:11
bert_for_corrector基于bert进行中文文本纠错源码
BERT模型具有遮罩功能的正确错误字符 实在抱歉,之前做项目比较急,然后没有完全上传完文件,导致大家使用受阻,替换更新有人提醒该模型,近期发生,特意将奉上,提取码为:hhxx另外其中某些得文件也有发表
ZIP
17.04MB
2021-04-18 07:05
bert模型Python实现
该文档主要是bert论文的Python代码实现,在多个数据集实现较好效果
zip
0B
2019-09-07 01:41
bert-文本分类模型原理和应用探究
本文将深入探讨bert模型在文本分类中的原理和应用。首先介绍bert模型的基本概念和工作原理,然后详细讨论bert模型在文本分类任务中的应用实践,包括数据预处理、模型训练和评估等方面。同时,我们还将分
rar
742.48MB
2023-07-26 23:42
BERT文本分类数据
BERT文本分类代码对应的数据
CSV
1.48MB
2021-01-14 08:01
bert tokenizer文本预处理
在pytoch中实现利用预训练BertTokenizer对影评数据集IMDB进行预处理得到Bert模型所需输入样本特征.利用torch.utils.data将预处理结果打包为数据集并利用pickle将
py
2.7KB
2023-01-03 17:44