虚拟芒果

文章
6
资源
0
加入时间
2年10月17天

语音识别中半监督与无监督训练

背景端到端的语音识别需要大量成对的语音-文本数据,以获得更好的performance。然而目前来说成对的数据是相对较少的相比于有标签的语音文本对,无标签的语音数据更多ASR模型的准确率依赖语言模型的rescoring,而大量的纯文本数据可以用于语言模型的构建无监督与半监督的作用充分利用未成对的数据,通过预训练等方法,对模型整体或部分网络进行“强化”。具体方法无监督(unsupervised)...