深度学习网络模型训练---收敛速度慢

113 阅读 0 评论 75 点赞

我是靠谱客的博主爱笑小蘑菇，这篇文章主要介绍深度学习网络模型训练---收敛速度慢，现在分享给大家，希望可以做个参考。

问题

网络训练收敛速度慢

模型的问题，训练迭代时含大量参数

优化算法模型

网络模型的优化，通常是比较难的。但可以通过其他方式来加速收敛速度

例如：
同等设备同等情况下

在epoch＝20000 batch_size=64 学习率Ir=0.1 时
迭代次数为20000*（训练images/64）一次epoch需要 6min
程序总耗时 20000 * 6min=83.4 days

保持迭代次数和学习率不变， batch_size=5 时
则epoch=1563（迭代次数为1563*训练images/5）一次epoch需要 13min
程序总耗时 1563 * 13min = 14.1 days

当epoch=1563 batch_size=5 学习率Ir=0.15 时
一次epoch需要 7 min
程序总耗时 1563 * 7min=7.6 days

当epoch=1563 batch_size=5 学习率Ir=0.15 边运行边释放中间变量数组内存时
一次epoch需要 6 min 30s
程序总耗时 1563 * 6min30s=7 days

当epoch=1400 batch_size=5 学习率Ir=0.15 边运行边释放数组内存时
程序总耗时 1400 * 6min30s=6.3 days

当epoch=1400 batch_size=5 学习率Ir=0.15 边运行边释放中间变量数组内存简化程序时
一次epoch需要 6 min 10s
程序总耗时 1400 * 6min10s=6 days

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。