如何微调BERT用于自定义数据上的命名实体识别?

nfs0ujit  于 4个月前  发布在  其他
关注(0)|答案(5)|浏览(75)

我想在我的自定义数据集上微调BERT,但我不知道如何标记句子并进行微调。如果有人知道,请建议我。

d6kp6zgx

d6kp6zgx1#

你好,

我也在寻找同样的东西。
这里有一个指向colab笔记本的链接:https://colab.research.google.com/github/tensorflow/tpu/blob/master/tools/colab/bert_finetuning_with_cloud_tpus.ipynb
但是它仅限于MRPC、CoLA和MNLI任务,对于这些任务,您需要从语料库中获取适当的格式化数据集。
我原本以为能够使用masked language model任务在我的数据集(未标记)上微调。
你找到了其他东西吗?

ejk8hzay

ejk8hzay2#

@Anticsss @sofieneJ 我也在寻找这个。你们有人找到解决方案了吗?

vqlkdk9b

vqlkdk9b3#

我还尝试使用BERT进行自定义命名实体识别。我找到了一个类似的解决方案。可以查看
https://www.kaggle.com/amrkeleg/fine-tuning-bert-models-for-bio-entity-recognition
,它使用了BERT进行生物命名实体识别。

9ceoxa92

9ceoxa924#

这是关于BERT的建筑数据集格式吗?

yx2lnoni

yx2lnoni5#

我也需要同样的解决方案,有人能帮忙吗?

相关问题