bounty将在4天后过期。回答此问题可获得+50的声誉奖励。user1627466正在寻找来自声誉良好来源的答案:我正在寻找一个答案,它可以让我可视化一个特定的拟合树在测试集上的性能。理想情况下,它可以通过添加y_pred和y_test的值拆分来为每个节点添加更多细节。
例如,我们可以用训练集分布来可视化决策树
from matplotlib import pyplot as plt
from sklearn import datasets
from sklearn.tree import DecisionTreeClassifier
from sklearn import tree
# Prepare the data data, can do row sample and column sample here
iris = datasets.load_iris()
X = iris.data
y = iris.target
# Fit the classifier with default hyper-parameters
clf = DecisionTreeClassifier(random_state=1234)
clf.fit(X, y)
fig = plt.figure(figsize=(25,20))
_ = tree.plot_tree(clf,
feature_names=iris.feature_names,
class_names=iris.target_names,
filled=True)
给出了具有训练集分布的
,例如根节点中的value = [50, 50, 50]
。
但是,我不能给予它一个测试集,并得到测试集在可视化树中的分布。
1条答案
按热度按时间0yycz8jy1#
我不认为有一个sklearn方法可以做到这一点(还)。
您可以使用下面的自定义功能:
然后稍微修改一下脚本:
输出:
您可以使用下面的自定义功能:
然后稍微修改一下脚本:
输出: