查看: 4579|回复: 1

[原理资料] 神经网络 [复制链接]

zhouhuiya

军衔等级：

新兵

注册：2019-8-22

电梯直达

1^# 大中小

发表于 2019-12-29 15:14:25 |只看该作者 |倒序浏览

一般来说，调整神经网络参数W和b是需要大量的数据的，所以我们需要训练数据，对于有监督学习，训练数据会分为数据（X）和标签(Y_label)两个部分，在训练完之后，我们需要查看网络训练的好不好，也就是查看网络在训练集上的准确率。
另外，在训练集上的准确率高不能反映网络训练的好坏，需要在测试集上进行验证，即需要拿网络从来没有用过的数据去测试它，然后网络在测试集上的准确率。只有测试准确率高，才能说明网络训练的好。
另外，我们在进行网络设计的时候，网络的层数，卷积核的大小等等参数刚开始也无从下手，不知道怎么去确定，这些参数叫做超参数。一般我们会用数据进行训练来不断尝试这些超参数的好坏，这里用到的数据叫验证集（注意，在验证超参数的好坏的时候，不能用训练集的数据，因为训练集已经参与了网络参数的调整过程），所以，一般流程如下：在用训练集训练完之后，用验证集去判断哪个超参数最好，选择最好的那组超参数，然后用测试集去测试网络训练的准确度。
验证集一般从从训练集里面划分，例如把训练集划分为10，其中随机9分作为训练集，1份作为验证集，接着任选其余9份作为训练集，1份作为验证集，如此循环，反复去验证某一组超参数最优。
过拟合及抑制方法
过拟合
当网络学习能力比较强，训练集的数据少，训练的次数多的时候，可能会导致网络学习的过于细枝末节，造成了网络在训练集上准确率很高，在测试集上准确率急剧下降。这个现象就是过拟合。
例如，现在我们只想对是非人类进行判断，一个简单的是非问题。当训练集只有5张图片且5个人全是带着帽子或者眼镜。网络通过反复学习后，可能出现的情况就是，它认为必须带帽子或者眼镜的人才被认为是人，换句话说，网络的泛化能力就不行了，它没有学到人类的通用特征，而是学到了一些更细枝末节的东西，然后它以这些细节去评判是非人类，这样在测试时准确率当然会急剧下降。
————————————————
版权声明：本文为CSDN博主「小研一枚」的原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/qq_35027690/article/details/103490445

0 举报本楼

本帖有 1 个回帖，您需要登录后才能浏览登录 | 注册

返回列表

手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图

GMT+8, 2024-11-23 19:31 , Processed in 0.091483 second(s), 15 queries , Gzip On.

Discuz Licensed

		自动登录	找回密码
密码			注册