我想在我的自定义数据集上微调BERT,但我不知道如何标记句子并进行微调。如果有人知道,请建议我。
d6kp6zgx1#
你好,
我也在寻找同样的东西。这里有一个指向colab笔记本的链接:https://colab.research.google.com/github/tensorflow/tpu/blob/master/tools/colab/bert_finetuning_with_cloud_tpus.ipynb但是它仅限于MRPC、CoLA和MNLI任务,对于这些任务,您需要从语料库中获取适当的格式化数据集。我原本以为能够使用masked language model任务在我的数据集(未标记)上微调。你找到了其他东西吗?
ejk8hzay2#
@Anticsss @sofieneJ 我也在寻找这个。你们有人找到解决方案了吗?
vqlkdk9b3#
我还尝试使用BERT进行自定义命名实体识别。我找到了一个类似的解决方案。可以查看https://www.kaggle.com/amrkeleg/fine-tuning-bert-models-for-bio-entity-recognition,它使用了BERT进行生物命名实体识别。
9ceoxa924#
这是关于BERT的建筑数据集格式吗?
yx2lnoni5#
我也需要同样的解决方案,有人能帮忙吗?
5条答案
按热度按时间d6kp6zgx1#
你好,
我也在寻找同样的东西。
这里有一个指向colab笔记本的链接:https://colab.research.google.com/github/tensorflow/tpu/blob/master/tools/colab/bert_finetuning_with_cloud_tpus.ipynb
但是它仅限于MRPC、CoLA和MNLI任务,对于这些任务,您需要从语料库中获取适当的格式化数据集。
我原本以为能够使用masked language model任务在我的数据集(未标记)上微调。
你找到了其他东西吗?
ejk8hzay2#
@Anticsss @sofieneJ 我也在寻找这个。你们有人找到解决方案了吗?
vqlkdk9b3#
我还尝试使用BERT进行自定义命名实体识别。我找到了一个类似的解决方案。可以查看
https://www.kaggle.com/amrkeleg/fine-tuning-bert-models-for-bio-entity-recognition
,它使用了BERT进行生物命名实体识别。
9ceoxa924#
这是关于BERT的建筑数据集格式吗?
yx2lnoni5#
我也需要同样的解决方案,有人能帮忙吗?