导航菜单

机器学习/模型评估与选择
课程进度 39% · 第5/11章5/11章 · 标签 1/3
1

模型评估与选择

模型评估概述

模型评估是机器学习流程中的关键环节,用于衡量模型的泛化能力和预测效果。 不同任务类型需要不同的评估指标和方法。合理的评估能帮助我们选择最佳模型、 诊断模型问题、防止过拟合,并为模型优化提供方向。

分类问题评估回归问题评估评估方法

评估指标详解

分类评估指标

分类问题通常使用混淆矩阵(Confusion Matrix)来展示预测结果, 并基于此计算各项评估指标。混淆矩阵记录了真正例(TP)、假正例(FP)、 假反例(FN)和真反例(TN)的数量。

TPFPFNTN
  • 准确率(Accuracy):正确预测的比例,即 (TP + TN) / (TP + FP + FN + TN)
  • 精确率(Precision):预测为正类中实际为正类的比例,即 TP / (TP + FP)
  • 召回率(Recall):实际为正类中被正确预测的比例,即 TP / (TP + FN)
  • F1分数:精确率和召回率的调和平均,即 2 * (P * R) / (P + R)
2

回归评估指标

回归问题的评估主要关注预测值与真实值之间的误差大小。 常用的回归评估指标包括MSE、RMSE、MAE和决定系数R²。

回归线 vs 实际数据点(误差线)
  • MSE(均方误差):预测值与真实值差的平方的均值,对大误差惩罚更大
  • RMSE:MSE的平方根,与原始数据的单位一致,更易解释
  • MAE(平均绝对误差):预测值与真实值绝对误差的均值,对异常值鲁棒
  • R²(决定系数):模型解释方差的比例,取值范围[0,1],越接近1越好

交叉验证

交叉验证是一种评估模型泛化性能的统计方法。K折交叉验证将数据集分成K份, 每次取K-1份训练、1份验证,重复K次取平均结果,减少评估结果的方差。

训练集验证集训练集训练集
准确率精确率召回率F1MSE交叉验证