概述
测试目的:测试图片中阴影和拍摄图片的角度对文字识别的影响。
一、测试图片选择:
1. 阴影
1)图片中阴影占比:
①没有阴影;②阴影占 1/4 左右;③阴影占 1/2 左右;④阴影占 3/4 左右;⑤文字完全被阴影遮住。
2)阴影方向:
①横向;②纵向。
2. 拍摄角度
1)竖直方向上:
①45度;②90度;③135度。
2)水平方向上:
①45度;②90度;③135度。
二、测试结果(图片对比)
1. 阴影
1)横向阴影
①没有阴影(v_2)
没有阴影(v_3)
召回率:0.9399 / 1.0000
准确率: 0.9642 / 0.9351
耗时:1.819s / 1.206s
竞品:
②阴影占 1/4 左右(v_2)
阴影占 1/4 左右(v_3)
召回率:0.9957 / 0.9528
准确率:0.9671 / 0.9124
耗时: 2.042s / 0.838s
竞品:
③阴影占 1/2 左右(v_2)
阴影占 1/2 左右(v_3)
召回率:0.9399 / 1.0000
准确率:0.9634 / 0.9183
耗时:2.039s / 1.340s
竞品:
④阴影占 3/4 左右(v_2)
阴影占 3/4 左右(v_3)
召回率:0.9957 / 1.0000
准确率:0.9717 / 0.9149
耗时:2.442s / 0.707s
竞品:
⑤文字完全被阴影遮住(v_2)
文字完全被阴影遮住(v_3)
召回率:0.9914 / 1.0000
准确率:0.9688 / 0.9185
耗时:1.881s / 1.208s
竞品:
2)纵向阴影
①没有阴影(v_2)
没有阴影(v_3)
召回率:0.9399 / 1.0000
准确率:0.9642 / 0.9351
耗时:1.820s / 1.211s
竞品:
②阴影占 1/4 左右(v_2)
阴影占 1/4 左右(v_3)
召回率:0.9957 / 1.0000
准确率:0.9608 / 0.9267
耗时: 1.746s / 1.247s
竞品:
③阴影占 1/2 左右(v_2)
阴影占 1/2 左右(v_3)
召回率:0.9957 / 0.9571
准确率:0.9630 / 0.9219
耗时:2.021s / 1.132s
竞品:
④阴影占 3/4 左右(v_2)
阴影占 3/4 左右(v_3)
召回率:0.9957 / 1.0000
准确率:0.9659 / 0.9158
耗时:2.306s / 0.756s
竞品:
⑤文字完全被阴影遮住(v_2)
文字完全被阴影遮住(v_3)
召回率:1.0000 / 1.0000
准确率:0.9610 / 0.9218
耗时:1.822s / 1.864s
竞品:
2. 拍摄角度
1)竖直方向
①45度(v_2)
45度(v_3)
召回率:0.9914 / 0.9142
准确率:0.9697 / 0.9203
耗时:2.480s / 0.763s
竞品:
②90度(v_2)
90度(v_3)
召回率:1.0000 / 0.9571
准确率:0.9673 / 0.9316
耗时:1.872s / 0.835s
竞品:
③135度(v_2)
135度(v_3)
召回率:0.9099 / 0.9914
准确率:0.9678 / 0.9099
耗时:3.642s / 0.953s
竞品:
2)水平方向
①45度(v_2)
45度(v_3)
召回率:0.9957 / 1.0000
准确率:0.9718 / 0.9161
耗时:1.956s / 0.671s
竞品:
②90度(v_2)
90度(v_3)
召回率:1.0000 / 0.9571
准确率:0.9674 / 0.9316
耗时:1.872s / 0.835s
竞品:
③135度(v_2)
135度(v_3)
召回率:1.0000 / 1.0000
准确率:0.9698 / 0.9186
耗时:1.417s / 0.599s
竞品:
三、测试结果数据对比
1. 阴影
1)横向
v_2 | 召回率 | 准确率 | 耗时 |
没有阴影 | 0.9399 | 0.9642 | 1.819s |
1/4 阴影 | 0.9957 | 0.9671 | 2.042s |
1/2 阴影 | 0.9399 | 0.9634 | 2.039s |
3/4 阴影 | 0.9957 | 0.9717 | 2.442s |
完全阴影 | 0.9914 | 0.9688 | 1.881s |
v_3 | 召回率 | 准确率 | 耗时 |
没有阴影 | 1.0000 | 0.9351 | 1.206s |
1/4 阴影 | 0.9528 | 0.9124 | 0.838s |
1/2 阴影 | 1.0000 | 0.9183 | 1.340s |
3/4 阴影 | 1.0000 | 0.9149 | 0.707s |
完全阴影 | 1.0000 | 0.9185 | 1.208s |
2)纵向
v_2 | 召回率 | 准确率 | 耗时 |
没有阴影 | 0.9399 | 0.9642 | 1.819s |
1/4 阴影 | 0.9957 | 0.9608 | 1.746s |
1/2 阴影 | 0.9957 | 0.9630 | 2.021s |
3/4 阴影 | 0.9957 | 0.9659 | 2.306s |
完全阴影 | 1.0000 | 0.9610 | 1.822s |
v_3 | 召回率 | 准确率 | 耗时 |
没有阴影 | 1.0000 | 0.9351 | 1.206s |
1/4 阴影 | 1.0000 | 0.9267 | 1.247s |
1/2 阴影 | 0.9571 | 0.9219 | 1.132s |
3/4 阴影 | 1.0000 | 0.9158 | 0.756s |
完全阴影 | 1.0000 | 0.9218 | 1.864s |
2. 拍摄角度
1)竖直方向
v_2 | 召回率 | 准确率 | 耗时 |
45度 | 0.9914 | 0.9697 | 2.480s |
90度 | 1.0000 | 0.9673 | 1.872s |
135度 | 0.9099 | 0.9678 | 3.642s |
v_3 | 召回率 | 准确率 | 耗时 |
45度 | 0.9142 | 0.92034 | 0.763s |
90度 | 0.9571 | 0.9316 | 0.835s |
135度 | 0.9914 | 0.9099 | 0.953s |
2)水平方向
v_2 | 召回率 | 准确率 | 耗时 |
45度 | 0.9957 | 0.9718 | 1.956s |
90度 | 1.0000 | 0.9673 | 1.872s |
135度 | 1.0000 | 0.9698 | 1.417s |
v_3 | 召回率 | 准确率 | 耗时 |
45度 | 1.0000 | 0.9161 | 0.671s |
90度 | 0.9571 | 0.9316 | 0.835s |
135度 | 1.0000 | 0.9186 | 0.599s |
四、总结
1. 阴影
1)无阴影时,可以检测一整行为一个文本框;在阴影覆盖区域,一行文字会被识别为多个文本框。
2)横向阴影和纵向阴影对文本检测识别的影响的区别不大。
3)阴影对文本检测和识别的影响不大。
2. 角度
1)水平方向上拍摄角度的不同,对检测识别的影响不大。
2)竖直方向上拍摄角度的不同,对检测识别的影响较大。
3. 模型
1)召回率:v_3 略优于 v_2 。
2)准确率:v_2 优于 v_3 。
3)耗时:v_2 大于 v_3 (v_3 的速度比 v_2 快)。
4)竞品的召回率和准确率较高(几乎都是1.0000),偶尔会出现连字现象;竞品检测识别速度大概在 5~6 秒(包含网络传播时延)。
最后
以上就是冷傲自行车为你收集整理的OCR测试——阴影和角度一、测试图片选择:二、测试结果(图片对比)三、测试结果数据对比四、总结的全部内容,希望文章能够帮你解决OCR测试——阴影和角度一、测试图片选择:二、测试结果(图片对比)三、测试结果数据对比四、总结所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复