pytorch Roberta在句子对分类中不能学习和预测正类

tpxzln5u 于 2022-11-09 发布在其他

关注(0)|答案(1)|浏览(138)

我正在使用Roberta训练一个句子对二元分类模型，但是该模型无法学习正类（标签为1的类）。我的数据集是不平衡的，因此：
训练数据-
0 ---140623位
1 ---5537
验证数据-
0 ---35156个单位
1 ---1384
在验证数据上，训练的结果是0个真阳性和0个假阳性。在评估过程中，我计算了宏F1，但如何在训练过程中处理类不平衡？有几篇文章提到BERT会处理不平衡本身。但在我的案例中，似乎没有发生这种情况。
我使用的是this数据集。
任何帮助都是感激不尽的。

pytorch

来源：https://stackoverflow.com/questions/72718647/roberta-is-not-able-to-learn-and-predict-positive-class-in-sentence-pair-classif