科学、量化的分析语音信号语音的基本特征

371 阅读 0 评论 245 点赞

我是靠谱客的博主洁净果汁，这篇文章主要介绍科学、量化的分析语音信号语音的基本特征，现在分享给大家，希望可以做个参考。

语音的基本特征

语音按照发音原理可以分为清音和浊音，语音的音调、能量分布等信息可以用基频、谐波、共振峰等特征来分析。为了更好地分析语音，我们先来看看语音是如何产生的？

我们可以结合图 1 的人体发音器官结构示意图来看一下我们的语音是如何产生的。

在这里插入图片描述

我们知道，声道就是声音传播所通过的地方。发音的声道主要是指我们的三个腔体，即咽腔、口腔和鼻腔。而语音是由声源和声道共同作用产生的。按照声源的不同我们把语音分成以下两类：

第一类是声带振动作为声源产生的声音，我们把它们叫做浊音。比如拼音中的 “a，o，e” 等。
第二类是由气体在经过唇齿等狭小区域由于空气与腔体摩擦而产生的声音，我们把它们叫做清音。比如拼音中的 “shi、chi、xi” 等。

那么清音和浊音的声源不同在频谱上有什么样的差异呢？我们先来看看语音的频谱图

在这里插入图片描述
图 2中显示的是“实时音视频互动”这几个字的音频信号的时域图和频域图（频谱图）。时域就是信号幅度和时间的关系，而频域指的是能量与时间和频率的关系。

频域更方便我们观察不同频率的能量分布。我们可以看到浊音，比如最后两个字“互动”是明显的有规律的能量分布，即低频能量大于高频且有明显的能量比较集中的地方，如频谱图中的亮线。而“实时”和“视”这几个字，都有 “sh” 这个由牙齿间高速气流产生的清音。清音

以上就是洁净果汁最近收集整理的关于科学、量化的分析语音信号语音的基本特征的全部内容，更多相关科学、量化内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。