librosa 语音库(二)STFT 的实现1. librosa.stft函数2. stft的输出帧数3. code
librosa是一个应用广泛的音频处理python库。在librosa中有一个方法叫做stft,功能是求音频的短时傅里叶变换。音频短时傅里叶变换后,在对音频取幅值,可以得到音频的线性谱。对线性谱进行mel刻度的加权求和,可以得到语音识别和语音合成中常用的mel谱。短时傅里叶变换的过程是先对音频分帧,再分别对每一帧傅里叶变换。在应用stft方法求解短时傅里叶变换时,发现求出的特征帧的数目有点反常。比如我有一个长度是400个点的音频,如果帧长是100,那么我自然而然的想到,最后应当得到4帧。但实际不