Inceptions -- GoogLeNet, V2, V3, V4
paper: Going deeper with convolutions
Inception-V1 GoogLeNet
paper: Rethinking the Inception Architecture for Computer Vision
Inception-v2,v3
新的Inceptionv3结构如下,论文在Inception-v2(BN-Inception)的基础上进行一些改进。

其中三种Inception结构如下



1.将大尺寸卷积分解为小尺寸卷积的堆叠。(e.g. 5x5卷积使用两个3x3卷积堆叠代替)
2.卷积操作的进一步分解。(e.g. 3x3卷积使用3x1卷积和1x3卷积堆叠代替)
3.辅助分类器中使用BatchNorm和Dropout性能会更好。
4.先进行Pooling再通过Inception模块,训练参数较少但模型表征能力变弱;先通过Inception模块再进行Pooling,训练参数会稍增加,但模型具有更好的表征能力。一个折中的方案如下所示,It is both cheap and avoids the representational bottleneck.

5.label-smoothing regularization
比较结果如下,应用以上所有性质的Inception称为Inceptionv3.

paper: Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning
Inception-V4
总体结构如下:

其中各模块参考论文:
- Stem -> Figure 3
- Inception-A -> Figure 4
- Reduction-A -> Figure 7
- Inception-B -> Figure 5
- Reduction-B -> Figure 8
- Inception-C -> Figure 6
##### Inception-ResNets
总体结构如下:

- Inception-ResNet-v1和Inceptionv3计算量相似,各模块参考Figure 14、10、7、11、12、13
- Inception-ResNet-v2和Inceptionv4计算量相似,各模块参考Figure 3、16、7、17、18、19
一些结果比较如下:



