加性注意力机制!清华和MSRA提出Fastformer:又快又好的Transformer新变体! 本文转载自:机器之心从训练与推理效率来看,清华和微软亚研提出的 Fastformer 无愧于「fast」。在过去的几年里,Transformer 及其变体在很多领域取得了巨大成功,但由于其... 计算机视觉 2024-09-20 50 点赞 0 评论 75 浏览