深度学习图像处理之VGG网络模型-迪斯科星球

1问题

探索不同深度的VGG网络

[_, 1, 28, 28]

[_, 16, 14, 14]

[_, 32, 14, 14]

[_, 64, 14, 14]

[-, 64, 7, 7]

[_, 128, 7, 7]

[_, 256, 7, 7]

[_, 256*7*7

[_, 512]

[_, 10]

维持特征图大小不变的情况下,持续提升通道数。

2方法

VGG网络是由牛津大学的视觉几何组（Visual Geometry Group）提出的卷积神经网络架构，其主要特点是网络深度更深，参数数量更多，并且效果和可移植性都比较好。VGG网络主要有两种结构，VGG16和VGG19，两者并没有本质上的区别，主要差异在于网络的深度。
VGG16是许多模型中的主干网络，它在原论文中提供了6个不同的配置，包括不同的深度（如11、13、16、19层）以及是否采用LRN等。在实际应用中，我们一般都会采用D这个配置。
VGG网络的原理是通过连续使用几个3x3的卷积核来代替较大卷积核（如7x7，5x5），这样可以在保证具有相同感知野的条件下，提升了网络的深度，在一定程度上提升了神经网络的效果。例如，VGG中使用了3个3x3卷积核来代替7x7卷积核，使用了2个3x3卷积核来代替5x5卷积核。
在维持特征图大小不变的情况下，持续提升通道数的VGG网络如下：

第一层卷积层：输入尺寸为[224, 224, 3]，输出尺寸为[_, 64, 7, 7]。
第二层卷积层：输入尺寸为[64, 7, 7]，输出尺寸为[_, 128, 7, 7]。
第三层卷积层：输入尺寸为[128, 7, 7]，输出尺寸为[_, 256, 7, 7]。
第四层卷积层：输入尺寸为[256, 7, 7]，输出尺寸为[_, 512]。
第五层卷积层：输入尺寸为[512]，输出尺寸为[_, 512]。
全连接层：输入尺寸为[512]，输出尺寸为[_, 10]。

3结语

1、VGG-11使用可复用的卷积块构造网络。不同的VGG模型可通过每个块中卷积层数量和输出通道数量的差异来定义。

2、块的使用导致网络定义的非常简洁。使用块可以有效地设计复杂的网络。

3、在VGG论文中，Simonyan和Ziserman尝试了各种架构。特别是他们发现深层且窄的卷积（即）比较浅层且宽的卷积更有效。

企业官网建设流程全解析

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

热门文章

文章分类

标签云

相关文章

需要专业的网站建设服务？