我是靠谱客的博主 伶俐大炮,最近开发中收集的这篇文章主要介绍HTK语音识别基础教程.ppt,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

您所在位置:网站首页 > 海量文档

&nbsp>&nbsp资格/认证考试&nbsp>&nbsp全国翻译资格认证

productView-ppt_46x35.gif

HTK语音识别基础教程.ppt33页

本文档一共被下载:load.gif次,您可全文免费在线阅读后下载本文档。

donwloaddoc.png

favdoc.png

baiduyixia.png

edit.png

full.png

下载提示

1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

2.该文档所得收入(下载+内容+预览三)归上传者、原创者。

3.登录后可充值,立即自动返金币,充值渠道很便利

步骤八:增加高斯混合数 高斯混合模型 1->2, 2->4, 4->8的顺序增加混合数 HHEd -B -H train/hmm16/macros -H train/hmm16/hmmdefs -M train/hmm17 script/mix1.hed train/tiedlist Mix.hed的内容: MU 2 {*.state[2-4].mix} 每增加一次混合数都必须用HERest进行重估 步骤九:测试声学模型 简易语言模型的建立 HVite进行识别 HResults显示识别结果 HLStats -s START END -b bigram -o word.lst word.lbl HBuild -s START END -n bigram word.lst work HVite -C ../common/configcross -H ../train/hmm31/macros -H ../train/hmm31/hmmdefs -S test2.scp -i recout.mlf -w work -p -1.0 -s 5.0 dict ../train/tiedlist HResults -I word.lbl ../train/tiedlist recout2.mlf F(n)= AC(h) + LM(h)*Weight+n*Penalty HTK/语音识别基础教程 目录 语音识别基础 HMM声学模型的训练和基本原理 概要 HMM的3大问题和算法简介 HTK声学模型训练完整步骤 数据的准备 特征量的提取,音素列表,转写文本,发音字典等 HMM的两种初始化方式(HInit,HCompV) Monophone的训练 Triphone的训练(WI,Cross-word) Tied-State Triphone的训练 高斯混合数的增加 语音识别的基础原理 语音识别可以看作是已知观测到语音信号X,求出其语言内容(文字)w,即 最大化的 : 由声学模型得到(声学似然度), 由语言模型决定(先验知识) HMM模型概要 基本概念 HMM与语音信号 状态,状态迁移/输出概率,观测信号序列 3状态音素HMM(非静音):Left-to-right(2-3-4,不允许4-3) without skips(不允许2-4) 参数(各状态迁移概率,信号输出概率:高斯分布) 1 2 5 3 4 O1 O2 O5 O3 O4 O6 HMM构成要素 状态集合: 开始状态 和终了状态 为固定状态,不输出信号 状态迁移概率: 输出概率: 从状态 输出信号o的概率 输出信号系列 观测到的语音信号,如MFCC等特征量 状态系列: 时刻n对应状态 HMM三大基本问题(具体参考dean/ebooks下的《经典》) 评价问题 (Forward算法) 已知观察序列 和模型参数 ,如何有效的计算 (即模型对数据的拟合程度) 解码问题(Viterbi算法) 已知观察序列 和模型参数 ,在最佳意义上确定一个状态序列 训练问题(EM,Baum-Welch重估) 已知观察序列 和模型参数 ,如何调整模型参数 使 最大 HMM模型评价算法(前项算法) S0 S1 S2 S3 SM 时刻n 状 态 m N 0 N+1 O(1) O(2) O(N) HMM模型评价算法(前项算法) S0 S1 S2 S3 1.0 0.6 0.4 0.2 0.8 a b b (a,b)=(0.7,0.3) (a,b)=(0.6,0.4) 1.0 ×0.7 0.7 ×1.0 0.0 ×0.3 0.126 ×0.4 0.112 ×0.3 0.023 ×0.4 0.029 ×0.4 ×0.4 ×0.6 ×0.6 ×0.2 ×0.2 ×0.8 0.024 两种可能的路径: {S0S1S1S2S3} {S0S1S2S2S3} 两者之和便为信号{abb} 的输出概率: HMM模型评价算法(前项算法) 初期化: 初期迁移: 递进式:对于 , 最终迁移: HMM解码:Viterbi算法 S0 S1 S2 S3 1.0 0.6 0.4 0.2 0.8 a b b (a,b)=(0.7,0.3) (a,b)=(0.6,0.4) 1.0 ×0.

发表评论

请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。

用户名:

验证码:

detail-code.png

匿名?

发表评论

最后

以上就是伶俐大炮为你收集整理的HTK语音识别基础教程.ppt的全部内容,希望文章能够帮你解决HTK语音识别基础教程.ppt所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(55)

评论列表共有 0 条评论

立即
投稿
返回
顶部