概述
本文提出一种新的基于DCT频率域的通道注意力,其在分类、检测和分割任务上,性能优于SENet、CBAM和GCNet等主干,代码和模型即将开源!
注:文末附计算机视觉交流群
FcaNet: Frequency Channel Attention Networks
- 作者单位:浙江大学(李玺团队)
- 代码:https://github.com/dcdcvgroup/FcaNet
- 论文:https://arxiv.org/abs/2012.11879
注意力机制,尤其是通道注意力,在计算机视觉领域取得了巨大的成功。许多工作专注于如何设计有效的通道注意力机制,同时忽略一个基本问题,即使用全局平均池(GAP)作为毫无疑问的预处理方法。
在这项工作中,我们从不同的角度出发,并使用frequency analysis重新考虑通道的注意力。基于频率域分析,我们在数学上证明了传统的GAP是频域中特征分解的特例。有了证明,我们自然地在频域上概括了通道注意力机制的预处理,并提出了具有新颖的multi-spectral通道注意力的FcaNet。
所提出的方法简单但有效。我们只在计算中更改一行代码,以在现有通道注意力方法中实施我们的方法。
主要贡献:
实验结果
与其他在图像分类,目标检测和实例分割任务上的通道注意力方法相比,该方法可实现最新的结果。与基线SENet-50相比,在相同数量的参数和相同的计算成本的情况下,我们的方法在ImageNet上的Top-1准确性方面可提高1.8%。我们的代码和模型将公开提供。
CVer-计算机视觉交流群
建了CVer微信交流群!细分方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。
想要进计算机视觉学习交流群的同学,可以直接加微信号:CVer5555。加的时候备注一下:研究方向+学校+昵称,即可。然后就可以拉你进群了。
强烈推荐大家关注CVer知乎账号和CVer微信公众号,可以快速了解到最新优质的CV论文。
最后
以上就是含蓄衬衫为你收集整理的修改一行代码,简单粗暴涨点!浙大提出FcaNet:频率域通道注意力网络主要贡献:实验结果CVer-计算机视觉交流群的全部内容,希望文章能够帮你解决修改一行代码,简单粗暴涨点!浙大提出FcaNet:频率域通道注意力网络主要贡献:实验结果CVer-计算机视觉交流群所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复