Caffe神经网络solver及其配备详细说明

89542767 发布于2022-12-24 15:02 / 444人阅读

　　文中关键给大家介绍了Caffe神经网络solver及其配备详细说明，感兴趣的小伙伴可以参考借鉴一下，希望可以有一定的帮助，祝愿大家多多的发展，尽早涨薪

　　前言

　　solver算是caffe的最核心的关键，它融洽着全部建模运行。caffe程序执行必带的另一个主要参数就是solver环境变量。运行代码一般为

　　#caffe train--solver=*_slover.prototxt

　　在DeepLearning中，通常lossfunction是非凸的，并没有解析解，我们应该依据优化策略来求得。solver的关键作用是更替启用非前（forward)优化计算方法和时向（backward)优化计算方法来刷新主要参数，进而降到最低loss，实际上是一类提升的优化计算方法。

　　至目前版本，caffe带来了6种优化计算方法来求得最佳主要参数，在solver环境变量中，可设置type类型来挑选。

　　StochasticGradientDescent(type:"SGD"),

　　AdaDelta(type:"AdaDelta"),

　　AdaptiveGradient(type:"AdaGrad"),

　　Adam(type:"Adam"),

　　Nesterov’sAcceleratedGradient(type:"Nesterov")and

　　RMSprop(type:"RMSProp")

　　具体每一种方式的讲解，请看本系列下篇文章,文中重点详细介绍solver环境变量的撰写。

　　Solver的步骤：

　　1.制定好必须改善的目标，及其用以学习培训的练习网络与用以鉴定的测试网络。（依据启用另一个环境变量prototxt去进行）

　　2.依据forward和backward提升的进行改善来跟主要参数。

　　3.定期进行的点评测试网络。（可设置几回训练后，做一次检测）

　　4.在提升环节中表明建模和solver的情况

　　在每次的循环迭代中，solver进行了这两步工作中：

　　1、调用forward算法进行计算最后的导出值，及其相匹配的loss

　　2、调用backward算法进行计算各层的梯度方向

　　3、依据采用的slover方法，运用梯度方向开展主要参数刷新

　　4、统计并储存每一次提升的学习率、快照更新，及其相对应的情况。

　　下面，我们首先来说个案例：

　　net:"examples/mnist/lenet_train_test.prototxt"
　　test_iter:100
　　test_interval:500
　　base_lr:0.01
　　momentum:0.9
　　type:SGD
　　weight_decay:0.0005
　　lr_policy:"inv"
　　gamma:0.0001
　　power:0.75
　　display:100
　　max_iter:20000
　　snapshot:5000
　　snapshot_prefix:"examples/mnist/lenet"
　　solver_mode:CPU

　　接下来，我们对每一行进行详细解译：

　　net:"examples/mnist/lenet_train_test.prototxt"

　　设置深度网络模型。每一个模型就是一个net，需要在一个专门的配置文件中对net进行配置，每个net由许多的layer所组成。每一个layer的具体配置方式可参考本系列文文章中的（2）-（5）。注意的是：文件的路径要从caffe的根目录开始，其它的所有配置都是这样。

　　训练测试模型

　　也可用train_net和test_net来对训练模型和测试模型分别设定。例如：

　　train_net:"examples/hdf5_classification/logreg_auto_train.prototxt"
　　test_net:"examples/hdf5_classification/logreg_auto_test.prototxt"

　　接下来第二行：

　　test_iter:100

　　这个要与test layer中的batch_size结合起来理解。mnist数据中测试样本总数为10000，一次性执行全部数据效率很低，因此我们将测试数据分成几个批次来执行，每个批次的数量就是batch_size。假设我们设置batch_size为100，则需要迭代100次才能将10000个数据全部执行完。因此test_iter设置为100。执行完一次全部数据，称之为一个epoch

　　test_interval:500

　　测试间隔。也就是每训练500次，才进行一次测试。

　　base_lr:0.01
　　lr_policy:"inv"
　　gamma:0.0001
　　power:0.75

　　这四行可以放在一起理解，用于学习率的设置。只要是梯度下降法来求解优化，都会有一个学习率，也叫步长。base_lr用于设置基础学习率，在迭代的过程中，可以对基础学习率进行调整。怎么样进行调整，就是调整的策略，由lr_policy来设置。

　　lr_policy可以设置为下面这些值，相应的学习率的计算为：

　　-fixed:保持base_lr不变.

　　-step:如果设置为step,则还需要设置一个stepsize,返回base_lr*gamma^(floor(iter/stepsize)),其中iter表示当前的迭代次数

　　-exp:返回base_lr*gamma^iter，iter为当前迭代次数

　　-inv:如果设置为inv,还需要设置一个power,返回base_lr*(1+gamma*iter)^(-power)

　　-multistep:如果设置为multistep,则还需要设置一个stepvalue。这个参数和step很相似，step是均匀等间隔变化，而multistep则是根据stepvalue值变化

　　-poly:学习率进行多项式误差,返回base_lr(1-iter/max_iter)^(power)

　　-sigmoid:学习率进行sigmod衰减，返回base_lr(1/(1+exp(-gamma*(iter-stepsize))))

　　multistep示例：

　　base_lr:0.01
　　momentum:0.9
　　weight_decay:0.0005
　　#The learning rate policy
　　lr_policy:"multistep"
　　gamma:0.9
　　stepvalue:5000
　　stepvalue:7000
　　stepvalue:8000
　　stepvalue:9000
　　stepvalue:9500

　　参数

　　接下来的参数：

　　momentum：0.9

　　上一次梯度更新的权重，具体可参看下一篇文章。

　　type:SGD

　　优化算法选择。这一行可以省掉，因为默认值就是SGD。总共有六种方法可选择，在本文的开头已介绍。

　　weight_decay:0.0005

　　权重衰减项，防止过拟合的一个参数。

　　display:100

　　每训练100次，在屏幕上显示一次。如果设置为0，则不显示。

　　max_iter:20000
　　max_iter:20000

　　最大迭代次数。这个数设置太小，会导致没有收敛，精确度很低。设置太大，会导致震荡，浪费时间。

　　snpshot:5000
　　snapshot_prefix:"examples/mnist/lenet"

　　快照。将训练出来的model和solver状态进行保存，snapshot用于设置训练多少次后进行保存，默认为0，不保存。snapshot_prefix设置保存路径。

　　还可以设置snapshot_diff，是否保存梯度值，默认为false,不保存。

　　也可以设置snapshot_format，保存的类型。有两种选择：HDF5和BINARYPROTO，默认为BINARYPROTO

　　solver_mode:CPU

　　设置运行模式。默认为GPU,如果你没有GPU,则需要改成CPU,否则会出错。

　　注意：以上的所有参数都是可选参数，都有默认值。根据solver方法（type)的不同，还有一些其它的参数，在此不一一列举。

　　综上所述，这篇内容就给大家介绍到这里了，希望可以给大家带来帮助。

云服务器 GPU云服务器详细说明安装php详细说明 icp备案流程详细说明 cn.com域名详细说明

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/128771.html

caffe的python插口形成solver文件详细说明学习培训

　　本文主要是给大家介绍了caffe的python插口形成solver文件详细说明学习培训实例，感兴趣的小伙伴可以参考借鉴一下，希望可以有一定的帮助，祝愿大家多多的不断进步，尽早涨薪　　也有一些基本参数必须计算出来的，并不是乱设定。　　solver.prototxt的文件参数设置　　caffe在训练的时候，需要一些参数设置，我们一般将这些参数设置在一个叫solver.prototxt的文件里面，如...

89542767 2022-12-24 15:57 评论0 收藏0
caffe的python插口制作loss和accuracy曲线图

　　此篇文章主要是给大家介绍了caffe的python插口制作loss和accuracy曲线图实例详细说明，感兴趣的小伙伴可以参考借鉴一下，希望可以有一定的帮助，祝愿大家多多的发展，尽早涨薪　　前言　　使用python插口来运行caffe程序流程，根本原因是python很容易数据可视化。所以才建议大家在cmd下边运行python程序流程。如果一定要在cmd下边运作，不如直接用c++算了。　　强烈推...

89542767 2022-12-23 21:37 评论0 收藏0
caffe的python插口之手写数字识别mnist案例

　　文中主要是给大家介绍了caffe的python插口之手写数字识别mnist案例详细说明，感兴趣的小伙伴可以参考借鉴一下，希望可以有一定的帮助，祝愿大家多多的发展，尽早涨薪　　论文引言　　机器学习第一个案例一般都是是mnist，只需这个案例彻底搞懂了，其他的便是触类旁通的事了。因为字数缘故，文中不简单介绍环境变量里边每一个指标的具体函义，如果要搞明白的，请参考我之前的微博文章：　　数据访问层及主...

89542767 2022-12-24 15:52 评论0 收藏0

发表评论

登陆后可评论

0条评论

89542767

男|高级讲师

我要关注我要私信

TA的文章

pythontime控制模块时间格式与结构型时长详细说明

阅读 1045·2023-01-14 11:38
OpenMV与JSON编码问题分析

阅读 1042·2023-01-14 11:04
python中的特性管理模式详细说明

阅读 874·2023-01-14 10:48
Python运用fastapi完成上传图片

阅读 2330·2023-01-14 10:34
pythonopencv图象高通滤波和低通滤波器的范例编码

阅读 1117·2023-01-14 10:24
Python根据ssh远程桌面连接Mysql数据库操作

阅读 1008·2023-01-14 10:18
本文轻轻松松掌握Python中类的继承

阅读 636·2023-01-14 10:09
python中wordcloud组装方式总结

阅读 711·2023-01-14 10:02

资讯专栏INFORMATION COLUMN

上云采购季！| 2核2G4M爆款云服务器低至59元/年，更有多台、长期优惠，快来选购！

Caffe神经网络solver及其配备详细说明

相关文章

caffe的python插口形成solver文件详细说明学习培训

caffe的python插口制作loss和accuracy曲线图

caffe的python插口之手写数字识别mnist案例

发表评论

0条评论

89542767

男|高级讲师

TA的文章

pythontime控制模块时间格式与结构型时长详细说明

OpenMV与JSON编码问题分析

python中的特性管理模式详细说明

Python运用fastapi完成上传图片

pythonopencv图象高通滤波和低通滤波器的范例编码

Python根据ssh远程桌面连接Mysql数据库操作

本文轻轻松松掌握Python中类的继承

python中wordcloud组装方式总结

最新活动