我是靠谱客的博主 冷傲自行车,最近开发中收集的这篇文章主要介绍OCR测试——阴影和角度一、测试图片选择:二、测试结果(图片对比)三、测试结果数据对比四、总结,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

测试目的:测试图片中阴影和拍摄图片的角度对文字识别的影响。

一、测试图片选择:

1. 阴影

1)图片中阴影占比:

①没有阴影;②阴影占 1/4 左右;③阴影占 1/2 左右;④阴影占 3/4 左右;⑤文字完全被阴影遮住。

2)阴影方向:

①横向;②纵向。

2. 拍摄角度

1)竖直方向上:

①45度;②90度;③135度。

2)水平方向上:

①45度;②90度;③135度。

二、测试结果(图片对比)

1. 阴影

1)横向阴影

①没有阴影(v_2)

没有阴影(v_3)

召回率:0.9399 / 1.0000

准确率: 0.9642 / 0.9351

耗时:1.819s / 1.206s

竞品:               

②阴影占 1/4 左右(v_2) 

阴影占 1/4 左右(v_3) 

召回率:0.9957 / 0.9528

准确率:0.9671 / 0.9124

耗时: 2.042s / 0.838s

竞品:

③阴影占 1/2 左右(v_2)

阴影占 1/2 左右(v_3)

召回率:0.9399 / 1.0000

准确率:0.9634 / 0.9183

耗时:2.039s / 1.340s 

竞品:

④阴影占 3/4 左右(v_2)

阴影占 3/4 左右(v_3)  

召回率:0.9957 / 1.0000

准确率:0.9717 / 0.9149

耗时:2.442s / 0.707s

竞品:

⑤文字完全被阴影遮住(v_2)

文字完全被阴影遮住(v_3)

召回率:0.9914 / 1.0000

准确率:0.9688 / 0.9185

耗时:1.881s / 1.208s

竞品:

2)纵向阴影

①没有阴影(v_2)

没有阴影(v_3)

召回率:0.9399 / 1.0000

准确率:0.9642 / 0.9351

耗时:1.820s / 1.211s

竞品:

②阴影占 1/4 左右(v_2)

阴影占 1/4 左右(v_3)

召回率:0.9957 / 1.0000

准确率:0.9608 / 0.9267

耗时: 1.746s / 1.247s

竞品:

③阴影占 1/2 左右(v_2)

阴影占 1/2 左右(v_3)

召回率:0.9957 / 0.9571

准确率:0.9630 / 0.9219

耗时:2.021s / 1.132s

竞品:

④阴影占 3/4 左右(v_2)

阴影占 3/4 左右(v_3)

召回率:0.9957 / 1.0000

准确率:0.9659 / 0.9158

耗时:2.306s / 0.756s

竞品:

⑤文字完全被阴影遮住(v_2)

文字完全被阴影遮住(v_3)

召回率:1.0000 / 1.0000

准确率:0.9610 / 0.9218

耗时:1.822s / 1.864s

竞品:

2. 拍摄角度

1)竖直方向

①45度(v_2)

45度(v_3)

召回率:0.9914 / 0.9142

准确率:0.9697 / 0.9203

耗时:2.480s / 0.763s

竞品:

②90度(v_2)

90度(v_3)

召回率:1.0000 / 0.9571

准确率:0.9673 / 0.9316

耗时:1.872s / 0.835s

竞品:

③135度(v_2)

135度(v_3)

召回率:0.9099 / 0.9914

准确率:0.9678 / 0.9099

耗时:3.642s / 0.953s

竞品:

2)水平方向

①45度(v_2)

45度(v_3)

召回率:0.9957 / 1.0000

准确率:0.9718 / 0.9161

耗时:1.956s / 0.671s

竞品:

②90度(v_2)

90度(v_3)

召回率:1.0000 / 0.9571

准确率:0.9674 / 0.9316

耗时:1.872s / 0.835s

竞品:

③135度(v_2)

135度(v_3)

召回率:1.0000 / 1.0000

准确率:0.9698 / 0.9186

耗时:1.417s / 0.599s

竞品:

三、测试结果数据对比

1. 阴影

1)横向

v_2召回率准确率耗时
没有阴影0.93990.96421.819s
1/4 阴影0.99570.96712.042s
1/2 阴影0.93990.96342.039s
3/4 阴影0.99570.97172.442s
完全阴影0.99140.96881.881s
v_3召回率准确率耗时
没有阴影1.00000.93511.206s
1/4 阴影0.95280.91240.838s
1/2 阴影1.00000.91831.340s
3/4 阴影1.00000.91490.707s
完全阴影1.00000.91851.208s

2)纵向

v_2召回率准确率耗时
没有阴影0.93990.96421.819s
1/4 阴影0.99570.96081.746s
1/2 阴影0.99570.96302.021s
3/4 阴影0.99570.96592.306s
完全阴影1.00000.96101.822s
v_3召回率准确率耗时
没有阴影1.00000.93511.206s
1/4 阴影1.00000.92671.247s
1/2 阴影0.95710.92191.132s
3/4 阴影1.00000.91580.756s
完全阴影1.00000.92181.864s

2. 拍摄角度

1)竖直方向

v_2召回率准确率耗时
45度0.99140.96972.480s
90度1.00000.96731.872s
135度0.90990.96783.642s
v_3召回率准确率耗时
45度0.91420.920340.763s
90度0.95710.93160.835s
135度0.99140.90990.953s

2)水平方向

v_2召回率准确率耗时
45度0.99570.97181.956s
90度1.00000.96731.872s
135度1.00000.96981.417s
v_3召回率准确率耗时
45度1.00000.91610.671s
90度0.95710.93160.835s
135度1.00000.91860.599s

四、总结

1. 阴影

1)无阴影时,可以检测一整行为一个文本框;在阴影覆盖区域,一行文字会被识别为多个文本框。

2)横向阴影和纵向阴影对文本检测识别的影响的区别不大。

3)阴影对文本检测和识别的影响不大。

2. 角度

1)水平方向上拍摄角度的不同,对检测识别的影响不大。

2)竖直方向上拍摄角度的不同,对检测识别的影响较大。

3. 模型

1)召回率:v_3 略优于 v_2 。

2)准确率:v_2 优于 v_3 。

3)耗时:v_2 大于 v_3 (v_3 的速度比 v_2 快)。

4)竞品的召回率和准确率较高(几乎都是1.0000),偶尔会出现连字现象;竞品检测识别速度大概在 5~6 秒(包含网络传播时延)。

最后

以上就是冷傲自行车为你收集整理的OCR测试——阴影和角度一、测试图片选择:二、测试结果(图片对比)三、测试结果数据对比四、总结的全部内容,希望文章能够帮你解决OCR测试——阴影和角度一、测试图片选择:二、测试结果(图片对比)三、测试结果数据对比四、总结所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(48)

评论列表共有 0 条评论

立即
投稿
返回
顶部