深度学习笔记其三:多层感知机和PYTORCH1. 多层感知机2. 多层感知机的从零开始实现3. 多层感知机的简洁实现4. 模型选择、欠拟合和过拟合5. 权重衰减6. 暂退法(Dropout)7. 前向传播、反向传播和计算图8. 数值稳定性和模型初始化9. 环境和分布偏移10. 实战Kaggle比赛:预测房价
在本章中,我们将第一次介绍真正的深度网络。最简单的深度网络称为多层感知机。多层感知机由多层神经元组成,每一层与它的上一层相连,从中接收输入;同时每一层也与它的下一层相连,影响当前层的神经元。当我们训练容量较大的模型时,我们面临着过拟合的风险。因此,本章将从基本的概念介绍开始讲起,包括过拟合、欠拟合和模型选择。为了解决这些问题,本章将介绍和等正则化技术。我们还将讨论数值稳定性和参数初始化相关的问题,这些问题是成功训练深度网络的关键。 在本章的最后,我们将把所介绍的内容应用到一个真实的案例:房价预测