深度学习导论作业
用SGD、批量和小批量算法,训练网络,给出最终权系数和四个样本的网络输出值。 其中,SGD训练1000轮,批量训练4000轮,小批量(2个样本一组)训练2000轮。
结合课堂练习,比较SGD、批量和小批量三种算法学习速度。 说明:每种算法学习1000轮,画出“轮-误差”曲线,其中误差等于4个实际输出与期望输出之差的平方和。
用SGD对数据2训练4000轮,给出最终权系数和四个样本的网络输出,验证训练结果是否有效?
训练浅层 NN 解决 XOR 问题。
尝试改变隐层节点个数(3、5、2? )。 观察能否解决XOR问题? 如何避免不收敛?
设计多分类问题的网络结构。 输入层节点数:25 隐层节点数:50 输出层节点数:5
用训练数据训练网络,用测试数据测试训练结果(注:运行多次观察结果是否变化,思考原因)
尝试构造其它测试数据测试网络。
Dropout & ReLU
手写数字识别(不使用框架),需将本人写的简简单单的神经网络框架放到 SP 目录下。
POI,需将本人写的简简单单的神经网络框架放到 SP2 目录下。
大作业2,论文复现,突然发现一个大问题,角色识别的数据集忘了归一化,以后再改吧。