愤怒蚂蚁

文章
7
资源
0
加入时间
3年1月8天

Mfcc+GMM训练性别检测器模型,达到识别音频性别的效果

首先我们要知道什么是mfcc特征?mfcc实际上就是获取音频的包络,包络是每个人声音的身份证,说白点,每个人的声道形状不一样,但是一个人的声道形状是固定的,这个就是身份证,发出来的声音自然有辨识度。所以我们要提取mfcc特征。怎么提取mfcc?预处理、分帧、加窗、快速傅里叶变换、逆傅里叶变换等第一步、读取音频文件a是.wav音频文件的路径fs是音频的采样率,采样率是每秒音频...

Android Studio 多环境打包

打包 App 的时候,要求是打成开发环境和生产环境的包,百度了一下,发现 Android Studio 中的 gradle 已经有解决方案了,这里做一下记录。操作主要是在 app/build.gradle 里操作的。在 build.gradle 的 buildType 中,默认是包含两个buildType的,分别是 debug ,及 release ,我们在其中插入以下代码androi...

带通采样定理简单记录

没有目的的学习是困难的,当初是为了过一遍信号处理的相关知识,遇到了带通采样定理,和奈奎斯特采样定理相比,简直麻烦的让人无法接受!转眼间,半年过去了,这次为了看论文而再次回顾带通采样定理时,发现,接受就好,也看了推导,反而觉得麻烦。下面简单的记录下带通采样定理,这个知识点,当你用的时候,你就不会认为它生涩难懂,因为比它难懂的东西太多了。为什么要用带通采样定理呢?按理说,奈奎斯特采样定理不是通...

Linux时间子系统(五) POSIX Clock

一、前言clock是timer的基础,任何一个timer都需要运作在一个指定的clock上来。内核中维护了若干的clock,本文第二章描述了clock的基本概念和一些静态定义的posix clock。根据计时的特点,clock分成两种:一种是真实世界的时间概念,另外一个是仅仅计算CPU执行时间 ,这两种clock分别在第三和第四章描述。从clock的生命周期来看,可以分成静态和动态的posix ...

【报告分享】元宇宙与虚拟数字人-清博智能(附下载)

摘要:元宇宙以5G技术/云计算/人工智能/区块链等为技术底座,与各技术互相成就,如:元宇宙的发展极大激活VR内容生态。当前布局元宇宙的企业有:Roblox、Facebook、EPIC、微软、腾讯、字节跳动、网易、米哈游、莉莉丝。虚拟数字人是元宇宙的关键要素,未来将广泛应用在金融、医疗、游戏、光电、教育等行业中,当前市面上已出现的虚拟数字人有虚拟VUP洛天依、虚拟KOL翎Ling、明星虚拟形象千喵、AYAYI(小红书种草达人)以及虚拟学生——“华智冰”高颜值学霸。来源:清博智能​..