可以看到在训练不到20批的时候，训练精度就与测试精度分道扬镳了。这算是一种过拟合。目前我们手上的工具箱也就剩数据增强还没用了。理论上数据增强可以弥补训练集太小的问题，从而缓解过拟合的现象。实话说，在实际操作中，这种方法已经被检验过有效了。但是总给人一种用一种机器去欺骗另一种机器的感觉，我个人觉得，机械化的数据增强应该早晚被更优秀的训练模型所取代。

阅读全文

通过BatchNormalization把CIFAR10的训练精度提升到85%

2022-04-21

在不借助数据增强的情况下，我们已经一路把验证精度从70%多提升到了80%的水平，今天，我们借助BatchNormalization可以进一步把精度提升到超过85%。话不多说，先看结果：

阅读全文

在Apple Silicon上关闭M1的GPU，仅用CPU进行Tensorflow训练

2022-04-18

在苹果M1系列芯片上运行tensorflow是可以通过插件tensorflow-metal进行GPU训练加速的，并且随着操作系统的升级以及插件的不断完善，M1的训练性能正在稳步提高，这也是苹果官方推荐的做法。

阅读全文

通过加深网络把CIFAR10的训练精度提升到80%

2022-04-15

这次继续，在原来网络的基础上，加深了卷积层的数量，从原来的3层卷积，加深到了6层。核心代码如下：

model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3),padding='same'))
model.add(layers.Conv2D(32, (3, 3), activation='relu',padding='same'))
model.add(layers.MaxPooling2D((2, 2)))

model.add(layers.Conv2D(64, (3, 3), activation='relu',padding='same'))
model.add(layers.Conv2D(64, (3, 3), activation='relu',padding='same'))
model.add(layers.MaxPooling2D((2, 2)))

model.add(layers.Conv2D(128, (3, 3), activation='relu',padding='same'))
model.add(layers.Conv2D(128, (3, 3), activation='relu',padding='same'))
model.add(layers.Flatten())
model.add(layers.Dropout(0.5))

model.add(layers.Dense(512, activation='relu'))
model.add(layers.Dropout(0.5))
model.add(layers.Dense(10, activation='softmax'))

阅读全文

使用简单的CNN训练CIFAR10，理解padding='same'的含义

2022-04-14

今天在训练CIFAR10数据的时候，稍微调整了下网络，对卷积层增加了padding，最终结果得到了一定的改善：

CleanShot 2022-04-14 at 20.05.02

阅读全文

普普通通的CNN训练CIFAR-10

2022-04-12

之前用VGG16训练了一次CIFAR10数据集，我还说用VGG16会有一个不错的起点呢，毕竟是业界训练好的模型嘛。结果今天用自建的卷积神经网络一测，结果出乎意料，自建的神经网络虽然训练精度的上升没有之前的快，但是验证精度也能达到75%的水平，跟上次区别不大。同时，虽然这次迭代次数有增加，但是得益于模型简化了许多，训练速度也提升了不少。话不多说，上结果：

阅读全文

槛槛之间，点点滴滴