transformer系列——detr详解1.基本思想2.整体网络架构 先来个CNN得到各Patch作为输入,再使用transformer做编码和解码编码方式跟VIT基本一样,重在在解码,Detr假设一张图片中最多有100个物体,直接预测100个坐标框。 transformer 2024-08-23 137 点赞 2 评论 207 浏览