我是靠谱客的博主 开朗大雁,最近开发中收集的这篇文章主要介绍3D目标检测经典模型比较,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

研一不知道干啥,下面罗列了最近看的一些3D目标检测模型,其中都当作笔记记录在了主页博客里,不过记得不规范的就设置为私密了。现在比较一下相当于复习了,下面简单列了他们的主要思路。(有错误理解欢迎指出)

首先是基于LSS范式的:

102036fca8084849ab62360312a47861.png

然后是基于transformer的:

5ae723595c964831b06ffc8aa7979a3d.png

然后是基于双目立体视觉的:

9045318d91fe4b0a8a0590f14c1b0d55.png

 

看了这些模型后的感受:

刚看基于transfromer的算法时,感觉未来的大方向就是类似于detr那种,感觉好简洁,摆脱了锚框和NMS,感觉网络可以放开干了,可是后面在detr的改进还是又加入了anchor的思想,希望基于注意力机制的模型可以多摆脱一些之前卷积网络的惯式,query在融合各种信息感觉更加自由,优雅。还有感觉双目立体视觉算法沿用了之前三维重建的很多思路,不过也差不多就是一回事,只是现在用于自动驾驶而已。还有就是看了nuscenes排行上排名前几的模型,感觉想上分就得加时序,对于视觉模型深度是最关键的点,得分高的模型不仅是多机位构造空间多视角,还要引入时序构造时序上的立体,还有就是bevdepth那种显示深度估计也起到不错的效果,不管显示隐式,我觉得在训练视觉模型时能用激光点云数据做监督才是本质。

只看论文不动手,感觉自己还是废物一个啊!

如果有研一做相同方向的可以私信我,一起学习,自己一个人学太自闭了

 

 

 

 

最后

以上就是开朗大雁为你收集整理的3D目标检测经典模型比较的全部内容,希望文章能够帮你解决3D目标检测经典模型比较所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(97)

评论列表共有 0 条评论

立即
投稿
返回
顶部