野性毛豆

文章
9
资源
0
加入时间
2年10月21天

语音识别(ASR)论文优选:全球最大的中英混合开源数据TALCS: An Open-Source Mandarin-English Code-Switching Corpus and a Speech

TALCS: An Open-Source Mandarin-English Code-Switching Corpus and a Speech Recognition Baseline本文是好未来在2022.06.27更新的文章,主要开源最大的中英混合训练语料,为语音识别的Code-switching方向研究做贡献。(开源数据统计可参见http://yqli.tech/page/data.html)由于本文主要工作是开源全球最大的中英混合数据,我们就不再介绍背景,直接查看数据集的情况​。该数