我是靠谱客的博主 醉熏白猫,最近开发中收集的这篇文章主要介绍走进语音识别中的WFST(四),觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

前一章说了WFST的determinzation这个算法,本章继续说说WFST中的优化操作,包括权重推移(weight pushing)和最小化操作(minimization)。

权重推移我们可以这么理解,我们有一双硕大的双手,然后对着WFST的尾巴一用力一推,然后权重就像波浪一样沿着各个路径被推向了前方,自行脑补~

效果图如下所示:
这里写图片描述
(注意tropical半环和log半环不太一样)

在很多序列识别的问题中我们都是通过找到最小的cost来解决问题的,那么在WFST中我们同样就是通过找到最大或者最小的权重路径来解决问题的。
而pushing后权重都集中在前面可以降低整体的搜索时间因为我们会一步步的把我们不需要的路径排除掉,这样一开始就可以排除掉了很多种可能路径。

一般的权重推移算法包括两个步骤:
1 给每个状态计算一个potential,计算方式如下:
这里写图片描述
2 很据上面计算的potential和实际权重差值来修改转移路径上的权重值。

两步的伪代码如下所示(比较简单就不详细说了):
这里写图片描述

最后

以上就是醉熏白猫为你收集整理的走进语音识别中的WFST(四)的全部内容,希望文章能够帮你解决走进语音识别中的WFST(四)所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(55)

评论列表共有 0 条评论

立即
投稿
返回
顶部