我想微调已经微调的BertForSequenceClassification模型,新的数据集只包含1个以前没有被模型看到的额外标签。
这样,我想在模型当前能够正确分类的标签集合中添加1个新标签。
此外,我不希望分类器权重被随机初始化,我希望保持它们的完整性,并根据数据集示例更新它们,同时将分类器层的大小增加1。
用于进一步微调的数据集可能如下所示:
sentece,label
intent example 1,new_label
intent example 2,new_label
...
intent example 10,new_label
我的模型的当前分类器层看起来像这样:
Linear(in_features=768, out_features=135, bias=True)
我怎么能做到呢?
这是个好方法吗?
1条答案
按热度按时间watbbzwu1#
您可以使用新值扩展模型的权重和偏差。请查看下面的注解示例:
输出:
请注意,你应该微调你的模型。新的权重是随机初始化的,因此会对性能产生负面影响。