深度学习图像处理之VGG网络模型
2026/6/26 0:13:47 网站建设 项目流程

1问题

探索不同深度的VGG网络

[_, 1, 28, 28]

[_, 16, 14, 14]

[_, 32, 14, 14]

[_, 64, 14, 14]

[-, 64, 7, 7]

[_, 128, 7, 7]

[_, 256, 7, 7]

[_, 256*7*7

[_, 512]

[_, 10]

维持特征图大小不变的情况下,持续提升通道数。

2方法

VGG网络是由牛津大学的视觉几何组(Visual Geometry Group)提出的卷积神经网络架构,其主要特点是网络深度更深,参数数量更多,并且效果和可移植性都比较好。VGG网络主要有两种结构,VGG16和VGG19,两者并没有本质上的区别,主要差异在于网络的深度。
VGG16是许多模型中的主干网络,它在原论文中提供了6个不同的配置,包括不同的深度(如11、13、16、19层)以及是否采用LRN等。在实际应用中,我们一般都会采用D这个配置。
VGG网络的原理是通过连续使用几个3x3的卷积核来代替较大卷积核(如7x7,5x5),这样可以在保证具有相同感知野的条件下,提升了网络的深度,在一定程度上提升了神经网络的效果。例如,VGG中使用了3个3x3卷积核来代替7x7卷积核,使用了2个3x3卷积核来代替5x5卷积核。
在维持特征图大小不变的情况下,持续提升通道数的VGG网络如下:

  1. 第一层卷积层:输入尺寸为[224, 224, 3],输出尺寸为[_, 64, 7, 7]。

  2. 第二层卷积层:输入尺寸为[64, 7, 7],输出尺寸为[_, 128, 7, 7]。

  3. 第三层卷积层:输入尺寸为[128, 7, 7],输出尺寸为[_, 256, 7, 7]。

  4. 第四层卷积层:输入尺寸为[256, 7, 7],输出尺寸为[_, 512]。

  5. 第五层卷积层:输入尺寸为[512],输出尺寸为[_, 512]。

  6. 全连接层:输入尺寸为[512],输出尺寸为[_, 10]。

3结语

1、VGG-11使用可复用的卷积块构造网络。不同的VGG模型可通过每个块中卷积层数量和输出通道数量的差异来定义。

2、块的使用导致网络定义的非常简洁。使用块可以有效地设计复杂的网络。

3、在VGG论文中,Simonyan和Ziserman尝试了各种架构。特别是他们发现深层且窄的卷积(即)比较浅层且宽的卷积更有效。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询