危机枫叶

文章
5
资源
0
加入时间
2年10月24天

[语音识别] kaldi -- aidatatang_200zh脚本解析:词典准备

输入:text(所有录音的分词文本信息- 如果是自己的数据没有人工分词可能要提前jieba等工具分词一下)输出:data/local/dict文件夹(含extra_questions.txt、lexicon.txt、silence_phones.txt、nonsilence_phones.txt、optional_silence.txt等文件)local/prepare_dict.sh || exit 1;流程:1.处理自身数据集- 获取数据集中所有单词【从text中获取】->