课程进度 39% · 第5/11章第5/11章 · 标签 1/3
— 1 —
模型评估与选择
模型评估概述
模型评估是机器学习流程中的关键环节,用于衡量模型的泛化能力和预测效果。 不同任务类型需要不同的评估指标和方法。合理的评估能帮助我们选择最佳模型、 诊断模型问题、防止过拟合,并为模型优化提供方向。
分类问题评估回归问题评估评估方法
评估指标详解
分类评估指标
分类问题通常使用混淆矩阵(Confusion Matrix)来展示预测结果, 并基于此计算各项评估指标。混淆矩阵记录了真正例(TP)、假正例(FP)、 假反例(FN)和真反例(TN)的数量。
- 准确率(Accuracy):正确预测的比例,即 (TP + TN) / (TP + FP + FN + TN)
- 精确率(Precision):预测为正类中实际为正类的比例,即 TP / (TP + FP)
- 召回率(Recall):实际为正类中被正确预测的比例,即 TP / (TP + FN)
- F1分数:精确率和召回率的调和平均,即 2 * (P * R) / (P + R)
— 2 —
回归评估指标
回归问题的评估主要关注预测值与真实值之间的误差大小。 常用的回归评估指标包括MSE、RMSE、MAE和决定系数R²。
- MSE(均方误差):预测值与真实值差的平方的均值,对大误差惩罚更大
- RMSE:MSE的平方根,与原始数据的单位一致,更易解释
- MAE(平均绝对误差):预测值与真实值绝对误差的均值,对异常值鲁棒
- R²(决定系数):模型解释方差的比例,取值范围[0,1],越接近1越好
交叉验证
交叉验证是一种评估模型泛化性能的统计方法。K折交叉验证将数据集分成K份, 每次取K-1份训练、1份验证,重复K次取平均结果,减少评估结果的方差。
准确率精确率召回率F1MSE交叉验证