语音之家SOTA | 同声传译现场 时政SpeechIO TIOBE Benchmark
本类素材,源语言说话人的音量一般会被压制得非常低,可听见,但听不清内容,从语音识别的角度来讲更像是一种噪声。这种人声噪声,对频谱造成的干扰比一般噪声要复杂得多,对语音系统的挑战也更大。内容上,本期测试内容很简单,主要是一些时政新闻中的常见词汇和话题。本场景为英文到中文的同传现场,场景目标是识别中文内容,由标注员负责切分并标注中文同传声音的片段。讯飞和阿里的引擎对低音量灵敏且对英文比较灵敏,经常识别出零散的英文乱码词汇,错误率较高。同传室,制作棚,同传人员周边安静,无噪声。组织语言常见卡顿,重复。