概述
如何扩充数据集
1、使用外部公开的数据集,比如从ImageNet中抽出相应的类
2、数据增广
3、若额外的未标记的数据集,采用半监督学习的方法利用起来
4、如果必要的话,将验证集加入训练
如何提高模型的表现
1、如果设备允许的话,尝试更深、更宽的模型
2、尝试把当前流行的结构诸如res模块、inception模块、attention机制等加入合适的位置
3、如果必要的话,做模型的集成。e.g.分类任务,用resnet50得出一组概率,用vgg19得出另一组概率,将它们相加取概率最大的标签作为最终的结果。
如何解决尺寸不平衡问题
这是某数据集的长宽分布图,可以发现图像的长宽比例变化很大。
解决图像尺寸不统一一般有两种方法:1)训练前resize 2) 网络最后采用自适应池化层。然而前者可能会使图像严重变样,后者难以应对极端情况。
对于严重的尺寸不平衡问题,有以下思路:
1)分块(patch)。训练时将图像分块输入网络,并且这些块的标签相同;推断(测试)时同样将图像分块输入网络,集成输出结果。可以每个块对应不同的网络也可以使用同一个网络。缺点是会打乱图像结构信息。
2)剪切(crop)。裁剪出一部分特征输入网络。比如center crop, 还可以去掉图像边缘的无关信息。然而图像特征不一定集中在中心。也可以尝试用random crop。
最后
以上就是故意小白菜为你收集整理的【图像分类实战】比赛技巧总结的全部内容,希望文章能够帮你解决【图像分类实战】比赛技巧总结所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复