假设我是一名医生,试图预测一个病人心脏病发作的概率,在临床环境中,我的方法是使用逻辑回归,例如:P(HA)= 1/1+e^-(b 0 + b1* 年龄+ b2* 人种+ b3* 性别+......+ bn* 变量_n)。
有没有可能从其他分类模型中获得预测概率?假设我使用XGboost,它在分类方面比逻辑回归有更好的性能。然后我选择了模型中最重要的10个特征。我想获得一个方程,该方程预测知道患者的10个特征的患者将发生心脏病发作?我不想只对患者进行分类,我想得到一个概率,我之所以问这个是因为我想预测高危人群的概率,这对于下面所有的分类模型(线性SVM、KNN、LDA)都是可能的吗?
非常抱歉,如果这听起来像一个愚蠢的问题,但我是相对较新的领域。任何帮助将不胜感激:)
1条答案
按热度按时间t98cgbkg1#
是的,可以从其他分类模型(如XGBoost、线性SVM、KNN、LDA等)中获得预测概率。预测概率通常比仅将观察结果分为两类(即心脏病发作或未发作)中的一种更具信息性。获得概率可以进行更好的风险评估和决策。
例如,在XGBoost中,您可以使用“predict_proba”函数来获得预测概率。此函数返回属于每个类的观测的预测概率。在您的示例中,它将返回患者心脏病发作或未发作的概率。
同样,在线性SVM中,可以将“probability”超参数设置为“True”并使用“predict_proba”函数来获取预测概率。在KNN中,可以使用某些实现(如scikit-learn)中提供的“predict_proba”函数。在LDA中,可以使用Bayes定理来获取预测概率。