摘要:交叉验证是经常用到的验证方法使用可以很大程度上简化交叉验证的过程使用过程见下方这里以模型为例训练集标签交叉验证的倍数返回结果的类型,可以自定义,也有很多默认选项例如就是返回准确率都是可以的这就是简单的用法,只有比较复杂,其他都比较简单
交叉验证是经常用到的验证方法
使用sklearn可以很大程度上简化交叉验证的过程
使用过程见下方:
from sklearn import cross_validation gbdt=GradientBoostingRegressor() score = cross_validation.cross_val_score(gbdt, train_set, label_set, cv=10, scoring="accuracy") 这里以gbdt模型为例 train_set:训练集 label_set:标签 cv: 交叉验证的倍数 scoring: 返回结果的类型,可以自定义,也有很多默认选项 例如‘accuracy’, 就是返回准确率 [‘accuracy‘, ‘adjusted_rand_score‘, ‘average_precision‘, ‘f1‘, ‘f1_macro‘, ‘f1_micro‘, ‘f1_samples‘, ‘f1_weighted‘, ‘log_loss‘, ‘mean_absolute_error‘, ‘mean_squared_error‘, ‘median_absolute_error‘, ‘precision‘, ‘precision_macro‘, ‘precision_micro‘, ‘precision_samples‘, ‘precision_weighted‘, ‘r2‘, ‘recall‘, ‘recall_macro‘, ‘recall_micro‘, ‘recall_samples‘, ‘recall_weighted‘, ‘roc_auc‘] 都是可以的
这就是简单的用法,只有scoring比较复杂,其他都比较简单
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/37922.html
摘要:还提供了,将多项式特征数据归一化和线性回归组合在了一起,大大方便的编程的过程。在机器学习算法中,主要的挑战来自方差,解决的方法主要有降低模型复杂度降维增加样本数使用验证集模型正则化。 多项式回归 多项式回归使用线性回归的基本思路 非线性曲线如图: showImg(https://segmentfault.com/img/bVbkn4q?w=372&h=252); 假设曲线表达式为:$y...
摘要:机器学习工程师纳米学位模型评价与验证项目预测波士顿房价欢迎来到预测波士顿房价项目在此文件中,我们已经提供了一些示例代码,但你还需要完善更多功能才能让项目成功运行。 机器学习工程师纳米学位 模型评价与验证 项目 1: 预测波士顿房价 欢迎来到预测波士顿房价项目!在此文件中,我们已经提供了一些示例代码,但你还需要完善更多功能才能让项目成功运行。除非有明确要求,你无需修改任何已给出的代码。习...
阅读 521·2021-08-31 09:45
阅读 1623·2021-08-11 11:19
阅读 870·2019-08-30 15:55
阅读 804·2019-08-30 10:52
阅读 2834·2019-08-29 13:11
阅读 2910·2019-08-23 17:08
阅读 2817·2019-08-23 15:11
阅读 3047·2019-08-23 14:33