我是靠谱客的博主 洁净果汁,最近开发中收集的这篇文章主要介绍科学、量化的分析语音信号语音的基本特征,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

语音的基本特征

语音按照发音原理可以分为清音和浊音,语音的音调、能量分布等信息可以用基频、谐波、共振峰等特征来分析。为了更好地分析语音,我们先来看看语音是如何产生的?

浊音和清音

我们可以结合图 1 的人体发音器官结构示意图来看一下我们的语音是如何产生的。

在这里插入图片描述

我们知道,声道就是声音传播所通过的地方。发音的声道主要是指我们的三个腔体,即咽腔、口腔和鼻腔。而语音是由声源和声道共同作用产生的。按照声源的不同我们把语音分成以下两类:

第一类是声带振动作为声源产生的声音,我们把它们叫做浊音。比如拼音中的 “a,o,e” 等。
第二类是由气体在经过唇齿等狭小区域由于空气与腔体摩擦而产生的声音,我们把它们叫做清音。比如拼音中的 “shi、chi、xi” 等。

那么清音和浊音的声源不同在频谱上有什么样的差异呢?我们先来看看语音的频谱图

在这里插入图片描述
图 2中显示的是“实时音视频互动”这几个字的音频信号的时域图和频域图(频谱图)。时域就是信号幅度和时间的关系,而频域指的是能量与时间和频率的关系。

频域更方便我们观察不同频率的能量分布。我们可以看到浊音,比如最后两个字“互动”是明显的有规律的能量分布,即低频能量大于高频且有明显的能量比较集中的地方,如频谱图中的亮线。而“实时”和“视”这几个字,都有 “sh” 这个由牙齿间高速气流产生的清音。清音

最后

以上就是洁净果汁为你收集整理的科学、量化的分析语音信号语音的基本特征的全部内容,希望文章能够帮你解决科学、量化的分析语音信号语音的基本特征所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(44)

评论列表共有 0 条评论

立即
投稿
返回
顶部