注意力机制：SENet详解

2024-04-27 17:16:03
开发
4

SENet（Squeeze-and-Excitation Networks）是2017年提出的一种经典的通道注意力机制，这种注意力可以让网络更加专注于一些重要的featuremap，它通过对特征通道间的相关性进行建模，把重要的特征图进行强化来提升模型的性能。论文链接代码实现

模型

SENet的模型结果如图所示：
在这里插入图片描述
网络的输入 $X$ 是个多通道的图片，其维度为 $H',W^′,C^′]$ ，经过一系列卷积等维度变化操作后得到U，其维度是 $[H, W, C]$ ，其中C是通道的数量，那么我们融合不同通道的特征呢，这个时候就进入到了SENet，对于U，先经过全局平均池化的操作，即将U的维度由 $[H, W, C]$ 变成 $[1, 1, C]$ ，这一步对应着上图中的 $F_{sq} ( \cdot)$ ，实际上是对每一个特征图的特征通过池化的方式做了一个总结，这个总结作为初始值送入后面的多层神经网络，学习到不同通道的权重。全连接层的结构为：
在这里插入图片描述
这个多层感知机的结构非常简单，就是两个全连接层和两个激活函数，在第一次全连接层后使用Relu激活函数，此时得到的输出维度为 $[1, 1, C^{''}]$ 。第二个全连接层后使用Sigmoid函数，将每层数值归一化到0-1之间，以此表示每个通道的权重，第二个全连接的输出也为 $[1, 1, C]$ 。得到了最后 $[1, 1, C]$ 的输出后，我们将 $U$ 和刚刚得到的权重结果相乘，得到最终的特征图 $\hat X$ ，它和 $U$ 的维度一致，但是在 $\hat X$ 中，不同特征图已经根据权重结果进行了重新加权。

代码

附上SENet的一个简单实现：

def SENet(input):
    #全局平均池化
    x = nn.AdaptiveAvgPool2d((1,1))(input)
    x = x.view(1, -1)
    #第一个全连接层
    x = nn.Linear(2, 1)(x)
    x = nn.functional.relu(x)
    #第二个全连接层
    x = nn.Linear(1, 2)(x)
    x = nn.functional.sigmoid(x)

    return x


if __name__ == '__main__':
    input = torch.ones(1, 2 ,2 ,2)
    output = SENet(input)
    # 将SENet的输出维度进行变化，以便后面的乘机操作
    output = output.view(input.shape[0], input.shape[1],1, 1)
    SE_output = input*output

原文地址:https://blog.csdn.net/zly_Always_be/article/details/138250973 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1784149499741081600.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

注意力机制：SENet详解

模型

代码

相关推荐

最近更新

热门阅读