Multilayer Perceptrons (MLP)
本章将介绍MLP,过拟合、欠拟合和模型选择,权重衰减和暂退法等正则化技术。
介绍
线性意味着单调,任何特征的增大都会导致模型输出的增大或减小,而现实世界的数据中,有很多数据之间的关系并不是线性的,如图片中某个像素对分类的影响、某个值对结果的影响更大。
多层感知机(Multilayer Perceptrons)在输出层和输入层之间增加一个或多个全连接隐藏层,并通过激活函数转换隐藏层的输出。提高了对非线性函数泛化能力。
- 激活函数:使 MLP 有能力表示非线性函数
- 隐藏层:在 MLP 中为全连接层(Fully Connected, FC)
- Tips: 下图中实际只有两层全连接层:输入层不涉及任何计算,输出只与隐藏层和输出层有关,所以下图 MLP 有 2 层全连接层。

激活函数
激活函数(activation function)通过计算加权和并加上偏置来确定神经元是否应该被激活, 它们将输入信号转换为输出的可微运算。大多数激活函数都是非线性的。