我是靠谱客的博主 感性老虎,最近开发中收集的这篇文章主要介绍语音信号处理基础(三)——基于MATLAB的语音采集与读写语音信号处理基础(三),觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

语音信号处理基础(三)

文章目录

  • 语音信号处理基础(三)
    • 语音采集与读写
      • 1.语音信号的特点
      • 2.语音信号采集的基本原理
      • 3.基于MATLAB的语音信号采集与读写
      • 4.实例

有关语音信号处理的发展请阅读前两篇博客
语音信号处理基础(一)
语音信号处理基础(二)

语音采集与读写

通过对大量语音信号的观察和分析发现,语音信号主要有下面两个特点

1.语音信号的特点

(1) 在频域内,语音信号的频谱分量主要集中在300-3400Hz的范围内。

利用这个特点,可以用一个防混叠的带通滤波器将此范围内的语音信号频率分出,然后按8kHz的采样

(2) 在时域内,语音信号具有“短时性”的特点

即在总体上,语音信号的特征是随着时间而变化的,但在一段较短时间间隔内,语音信号保持平稳。在浊音段表现出周期信号的特征,在轻音端表现出随机噪声的特征

2.语音信号采集的基本原理

将模拟信号变为数字信号,必须经过采样和量化,得到时间和幅度上均为离散的数字信号语音。采样时, 采样频率必须以高于受测信号的最高频率两倍以上的速度进行取样,才能正确地重建信号。

3.基于MATLAB的语音信号采集与读写

(1)wavrecord()函数:用来录制语音和音频信号。

基本语法:

y=waverecord(n,Fs,ch,'dtype')

n为采样点数,Fs为采样频率,ch为音频设备通道数(1或2表示单声道或立体声)'dtype’表示指定数据类型来记录声音

例如:speech = wavrecord(16000, 8000, 1, ‘double’);
采样的样点放入speech变量中,16000是要采样的点数,8000是采样率
1表示是单声道信号,‘double’

Fs=11025;%采样率为11025Hz
y=wavrecord(Fs*5,Fs,'int16');%录制5s的数据
wavplay(y,Fs); %播放录制的音频

(2)wavwrite()函数:写入wav声音文件

注意:在新版本的matlab中不再使用wavwrite,推荐使用audiowrite

函数语法

wavwrite(y,filename)

将保存在变量y的数据,保存到wav文件filename中,默认的采样率为8000Hz,采样位数为16位,y的各列为各个通道,因此立体声数据是两列的矩阵

wavwrite(y,Fs,N,filename)

按给定的采样率Fs和采样位数N,将保存在变量y的数指保存到war文件filename中,N可选值为8,16,24及32。输人的数据范围:y的垢管范周与采样位数N以及y的数据类型有关
在这里插入图片描述

load handel.mat %载入AMATLAB自带的示例音频数据文件

hfile ="Data_wavereard.wav";%准备写的音媒数据文件

wavwrite(y,Fs,hfile)%将y以Fs采样率写到文件中

(3)wavread()函数:读取声音文件

注意:在新版本的matlab中不再使用wavread,推荐使用audioread

函数语法

y =wavread(filename)

载人由filename字符串指定的wav文件,y为返回采样点的数据,若文件名filename不包含扩展名,wavread函数特添加.wav扩展名。

[y,Fs]=wavread(fiename)

返回文件的采样率Fs(Hz).

[y,Fs,nbits]=wavread(filename)

返回每次采样的位数nbits(位).

[y,Fs,nbits,opts]= wavread(filename)

返回包含wav文件额外信息的结构体opts,opts具体的字段与文件有关。

opts典型的两个字段为fmt和info,外别代表声音格式信息和描述标题作者等信息的文本。

load handel.mat            %载人MATLAB自带的示例音频数据文件
hfile ='Data_waveread,wav';%准备写的音额数据文件
wavwrite(y,Fs,hfile);     %将y以Fs采样率写到文件中
clear y Fs   %清除载入的y以及Fs
[y,Fs,nbits]= wavread(hfile);%从声音文件中载入数据,
                             %y为从声音文件载入的数据,
                             %Fs为采样率,nbits为采样使用的位数。
sound(y,Fs);  %播放声音
pause(4)      %暂停4s,与后面的声音分隔开

运行结果

播放起~哈利路亚

(4)wavplay()函数:在基于pc的音频输出设备上播放录制的音频

函数语法

wavplay(y,Fs)

在基于PC的音频输出设备上,播放保存在向量y中的音频信号。Fs是采样率(Hz)。默认的Fs为11025 Hz wavplay支持单通道或双通道(立体声)的音频信号。播放立体声,y必须为两列的矩阵

wavplay(y,Fs,mode)

指定在命令行下如何交互播放音频。

mnde的可选值为’syne’(默认):直到声音播放结束才返回到命令窗口;

当音频正在播放时,以async模式再次调用wavplay,wavplay将阻塞命令行直至上一个播放结束

load chirp;       %载入chip.mat到y和Fs
y1=y;Fs1 =Fs;     %备份y和Fs变量到y1和Fsl 
load gong;        %载人gong.mat到y和Fs中
wavplay(y1,Fs1,'asyne')   %播放chirp文件中的音频
wavplay(y,Fs)  %上述文件播放完后,才播放gong文件的音额

4.实例

自行录制一段语音,并存储为wa文件。要求:存储为way文件时,分别以采样频率、2倍采样频率和1/2采样频率存为三个wav文件,并将plot函数结合 subplot函数在一幅图上显示3个波形。横轴和纵轴带有标注。横轴的单位为秒(s),纵轴显示的为归一化后的数值。

实现代码

%自行录制一段语音,并存储为wa文件。
%要求:分别以采样频率、2倍采样频率和1/2采样频率存为三个wav文件,
%并将plot函数结合 subplot函数在一幅图上显示3个波形。
%横轴和纵轴带有标注。横轴的单位为秒(s),纵轴显示的为归一化后的数值。

Fs=8000;      %采样频率
duration=2;   %时间长度
n=duration*Fs;  %采样点数
t=(1:n)/Fs;    %采样时间
load handel.mat   %载入MATLAB自带的示例音频数据文件
hfile='Data_waveread.wav';   %准备写的音频数据samples=[1,n];  %读取样本数
[y,Fs]=audioread('hfile.wav',samples); 
ymax=max(abs(y)); %归一化
y=y/ymax;
audiowrite('original.wav',y,Fs);   %将原采样频率得到的音频存为original.wav
audiowrite('halfsam.wav',y,Fs/2);  %1/2倍采样频率得到的音频存为halfsam.wav
audiowrite('doublesam.wav',y,Fs*2);%2倍采样频率得到的音频存为doublesam.wav
[y1,Fsl]= audioread('halfsam.wav');% 读取halfsam.wav文件
t1=(1:length(y1))/Fsl;             %计算时间t1
[y2,Fs2]= audioread('doublesam.wav');% 读取doublesam.wav文件
t2=(1:length(y2))/Fs2;             %计算时间t2
subplot(311)               %作以原采样率采样的音频时间幅值波形图        axis([0 3 -1 1]);          %设定x轴与y轴的显示范围
plot(t,y);
xlabel('时间/s');
ylabel('幅度');
title('(a)初始采样率');
subplot(312)               %作以1/2倍采样率采样的音频时间幅值波形图
axis([0 3 -1 1]);          %设定x轴与y轴的显示范围
plot(t1,y1);
xlabel('时间/s');
ylabel('幅度');
title('(b)1/2采样率');
subplot(313)                %作以2倍采样率采样的音频时间幅值波形图
axis([0 3 -1 1]);           %设定x轴与y轴的显示范围
plot(t2,y2);
xlabel('时间/s');
ylabel('幅度');
title('(c)2倍采样率');

运行结果
在这里插入图片描述观察结果
分别以采样频率、2倍采样频率和1/2采样频率存为三个wav文件,发现它的波形一致。

原本2秒就能播放完的音频,以1/2采样频率采样后,需要4秒播才能放完。以2倍采样频率采样后,只需要1秒就播放完

为了能更好的感受以不同采样频率采样以后,语音信号的效果不同,编写代码测试试听三个音频文件

sound()函数:播放.wav等音频格式文件

语法

sound(filename,Fs)

以频率值Fs,播放音频文件

实现代码

%倾听以三个不同采样率得到的音频文件
Fs=8000;      %采样频率
duration=2;   %时间长度
n=duration*Fs;  %采样点数
t=(1:n)/Fs;    %采样时间
load handel.mat   %载入MATLAB自带的示例音频数据文件
hfile='Data_waveread.wav';   %准备写的音频数据
samples=[1,n];  %读取样本数
[y,Fs]=audioread('hfile.wav',samples); 
ymax=max(abs(y)); %归一化
y=y/ymax;
audiowrite('original.wav',y,Fs);   %将原采样频率得到的音频存为original
audiowrite('halfsam.wav',y,Fs/2);  %1/2采样频率得到的音频存为halfsam
audiowrite('doublesam.wav',y,Fs*2);%2倍采样频率得到的音频存为doublesam
[y1,Fs1]= audioread('halfsam.wav');% 读取halfsam.wav文件
[y2,Fs2]= audioread('doublesam.wav');% 读取doublesam.wav文件
sound(y,Fs);          %播放以初始采样率采样后的声音
pause(4)              %暂停4s,与后面的声音分开
sound(y1,Fs1);        %播放以1/2倍采样率采样后的声音
pause(4)              %暂停4s,与后面的声音分开
sound(y2,Fs2);        %播放以2倍采样率采样后的声音

运行结果

1/2原始采样频率得到的音频相比以初始采样频率得到的音频慢放

2倍原始采样频率得到的音频相比以初始采样频率得到的音频快放

最后

以上就是感性老虎为你收集整理的语音信号处理基础(三)——基于MATLAB的语音采集与读写语音信号处理基础(三)的全部内容,希望文章能够帮你解决语音信号处理基础(三)——基于MATLAB的语音采集与读写语音信号处理基础(三)所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(40)

评论列表共有 0 条评论

立即
投稿
返回
顶部