3.4.8.2. 测量决策树性能¶

演示在训练集上测试时过度拟合。

获取数据

fromsklearn.datasetsimportfetch_california_housing
data=fetch_california_housing(as_frame=True)

训练和测试模型

fromsklearn.treeimportDecisionTreeRegressor
clf=DecisionTreeRegressor().fit(data.data,data.target)
predicted=clf.predict(data.data)
expected=data.target

绘制预测值与预期值的函数关系图

importmatplotlib.pyplotasplt
plt.figure(figsize=(4,3))
plt.scatter(expected,predicted)
plt.plot([0,5],[0,5],"--k")
plt.axis("tight")
plt.xlabel("True price ($100k)")
plt.ylabel("Predicted price ($100k)")
plt.tight_layout()

几乎没有错误！

这太好了，不像是真的：我们正在使用训练数据测试模型，这不是泛化能力的衡量标准。

结果无效

脚本总运行时间：（0 分钟 1.467 秒）

由 Sphinx-Gallery 生成的图库

3.4.8.2. 测量决策树性能¶

上一主题

下一主题

此页面