我应该使用哪个度量来表示二进制分类模型?

dauxcl2d  于 2021-07-14  发布在  Java
关注(0)|答案(1)|浏览(448)

我在不平衡的数据集上执行了一个支持向量机,在70/30中分割训练/测试。训练集中的示例数为类1的1163993和类0的234190个示例。对于测试集,我有498699个类1示例和100189个类0示例。svm的混淆矩阵如下所示:

我应该使用什么标准来评估模型?这可能是一个解决方案,使用f-avg,计算精度,回忆和f-1分数为每一类的方式:

然后通过计算每个班级的两个f-1分数的算术平均值来计算f-avg,如上表最后一行所述?

biswetbf

biswetbf1#

我假设你正在寻找一个概率评估指标。在我看来,使用auc-roc(它是使用精确度和召回率计算的)将是正确的方法,事实上对于大多数二元分类问题。
另请参阅本文。

相关问题