【NLP】自然语言处理学习笔记(一)语音识别前言TokenAcoustic FeatureModelssummaryLanguage ModelFusion
本笔记参考的课程是李宏毅老师的自然语言处理课程Link:https://aistudio.baidu.com/aistudio/education/lessonvideo/1000466Token是模型的输出形式,以上图语音识别为例,输出的text包含了N个Token,每个Token有V种符号目前,Token主要有下面五种具体形式:Phoneme音标,即语言的发音。如果想要换算成文本,需要有个Lexicon(词典表),例如cat ⟶ K AE TGrapheme字母最直接的形式,总数为26个字