鳗鱼睫毛

文章
4
资源
0
加入时间
3年1月13天

Vision Transformer:用于图像识别的Transformer

整体导读:尽管transformer体系结构已成为自然语言处理任务的实际标准,但其在计算机视觉中的应用仍然受到限制。在视觉上,注意力要么与卷积网络结合使用,要么用于替换卷积网络的某些组件,同时将其整体结构保持在适当的位置。2020年10月22日,谷歌人工智能研究院Alexey Dosovitskiy, Lucas Beyer等研究员将Transformer应用到图像识别上并在顶会“Computer Vision and Pattern Recognition(CVPR)”上发表一篇题为“An I