我是靠谱客的博主 难过斑马,最近开发中收集的这篇文章主要介绍49.端到端学习的利与弊 翻译自 吴恩达新书-Machine Learning Yearning,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

更多好玩的机器学习教程: 进入袋马学院领一份 ,全部免费?.

回想我们之前说的语音识别流程:
语音识别流程
流程中很多内容都是"手工工程":

  • MFCCs 是一系列手工设计的音频特征。这个特征提取过程会丢弃一些无用的信息,并整理出合理的音频摘要信息。
  • 音素是语音学家发明的。它是音频的一种不完美表示方法,用音素来表示音频会限制语音识别系统的性能。

然而,手动工程组件也有它的优势:

  • MFCC特征对那些不影响语音内容的因素,比如音高,具有很好的鲁棒性,这可以有效的简化机器学习算法要解决的问题。
  • 音素也是音频的一种合力表示。可以让算法了解基本的语音单元,然后帮助改进算法。

使用更多的手工工程组件,可以减少学习算法所需要的数据量。从手工工程MFCCs和因素获得的知识,而可以补充算法中数据中获得的知识。当我们没有很多数据时,这些知识就非常有用了。

现在,在考虑下端到端系统:
端到端系统流程

这个系统缺少手工工程相关的知识,因此当训练数据集很小时,他可能表现出的性能差于手工工程流程。

然而,当数据量比较大时,学习算法就不会受到MFCC或基于音素表示方法的限制了,如果学习算法是一个足够大的神经网络,而且有足够多的数据参与训练,它的潜力是非常大的,或许能达到最优的错误率。

端到端学习系统可以在两端(输入端、输出端)有大量已标记数据的情况下,表现的非常好。在这个例子中,我们需要准备大量的音频和对应的输出文本。当数据不可用时,端到端学习方法就有很大的风险了。

当你用机器学习算法解决问题时,如果训练样本集非常小,算法的大部分知识需要来自于人类的观察,比如手工工程设计的组件。

当你不使用端到端系统时,你需要考虑算法流程分成哪几步,这几步如何组装在一起,我们将会提供一些关于算法流程的设计建议。

更多好玩的机器学习教程: 进入袋马学院领一份 ,全部免费?.

最后

以上就是难过斑马为你收集整理的49.端到端学习的利与弊 翻译自 吴恩达新书-Machine Learning Yearning的全部内容,希望文章能够帮你解决49.端到端学习的利与弊 翻译自 吴恩达新书-Machine Learning Yearning所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(58)

评论列表共有 0 条评论

立即
投稿
返回
顶部