2026/6/26 0:13:47
网站建设
项目流程
1问题
探索不同深度的VGG网络
[_, 1, 28, 28]
[_, 16, 14, 14]
[_, 32, 14, 14]
[_, 64, 14, 14]
[-, 64, 7, 7]
[_, 128, 7, 7]
[_, 256, 7, 7]
[_, 256*7*7
[_, 512]
[_, 10]
维持特征图大小不变的情况下,持续提升通道数。
2方法
VGG网络是由牛津大学的视觉几何组(Visual Geometry Group)提出的卷积神经网络架构,其主要特点是网络深度更深,参数数量更多,并且效果和可移植性都比较好。VGG网络主要有两种结构,VGG16和VGG19,两者并没有本质上的区别,主要差异在于网络的深度。 VGG16是许多模型中的主干网络,它在原论文中提供了6个不同的配置,包括不同的深度(如11、13、16、19层)以及是否采用LRN等。在实际应用中,我们一般都会采用D这个配置。 VGG网络的原理是通过连续使用几个3x3的卷积核来代替较大卷积核(如7x7,5x5),这样可以在保证具有相同感知野的条件下,提升了网络的深度,在一定程度上提升了神经网络的效果。例如,VGG中使用了3个3x3卷积核来代替7x7卷积核,使用了2个3x3卷积核来代替5x5卷积核。 在维持特征图大小不变的情况下,持续提升通道数的VGG网络如下: 第一层卷积层:输入尺寸为[224, 224, 3],输出尺寸为[_, 64, 7, 7]。 第二层卷积层:输入尺寸为[64, 7, 7],输出尺寸为[_, 128, 7, 7]。 第三层卷积层:输入尺寸为[128, 7, 7],输出尺寸为[_, 256, 7, 7]。 第四层卷积层:输入尺寸为[256, 7, 7],输出尺寸为[_, 512]。 第五层卷积层:输入尺寸为[512],输出尺寸为[_, 512]。 全连接层:输入尺寸为[512],输出尺寸为[_, 10]。
|
3结语
1、VGG-11使用可复用的卷积块构造网络。不同的VGG模型可通过每个块中卷积层数量和输出通道数量的差异来定义。
2、块的使用导致网络定义的非常简洁。使用块可以有效地设计复杂的网络。
3、在VGG论文中,Simonyan和Ziserman尝试了各种架构。特别是他们发现深层且窄的卷积(即)比较浅层且宽的卷积更有效。