概述
TTS是Text To Speech的缩写,即“从文本到语音”,是人机对话的一部分,让机器能够说话。
语音播报功能的实现方式
- TTS语音模块,比如XFS5152、SYN6288等
- ISD4000系列语音录放芯片分段输出
- 可以按键、UART控制的mp3解码芯片模块
- OTP(One Time Programable)语音芯片[定制]
其中TTS语音模块使用起来最方便灵活,OTP语音芯片最简单。
本文将介绍一下科大讯飞的XFS5152CE语音合成模块。
XFS5152CE语音合成模块
XFS5152CE是一款高集成度的语音合成芯片,可实现中文、英文语音合成;并集成了语音编码、解码功能,可支持用户进行录音和播放;除此之外,还创新性地集成了轻量级的语音识别功能,支持30个命令词的识别。
内置的30个语音识别命令词
手册说如果需要定制命令词需要跟厂家联系,我体验了一下,识别的准确率不是很高。如果需要语音识别功能,可以使用LD3320模块,参考网文:
LD3320语音识别模块:LDV7模块使用详解如果需要录音模块,建议使用ISD系列录音芯片,参考网文:
简单好用的ISD1820语音录放芯片
为了使用方便,我们可以直接购买现成的XFS5152CE语音合成模块。
通讯接口
XFS5152CE 芯片支持 UART 接口、I2C 接口、SPI 接口三种通讯方式,可通过 UART 接口、 I2C 或 SPI 接口接收上位机发送的命令和数据,允许发送数据的最大长度为 4K字节。
用户在使用语音编解码功能时(通讯接口必须选择 UART 接口,并且波特率设置为 115200bps),上位机发送启动编解码的命令给语音芯片,芯片内部的语音编解码模块把采集到的音频数据进行编码并通过UART接口实时传送给上位机,或者对上位机传送来的音频数据进行解码并实时播放出来。
接线方式
- PC上使用官方演示程序《科大讯飞语音合成芯片PC端演示程序》,使用串口通信进行测试的接线方式如下:
- 如果使用单片机与XFS5152CE语音合成模块联用,模块的8脚和10脚与STM32的串口交叉连接(我使用的是串口2),7脚用于判断语音模块当前的状态,原理图如下所示:
注意:
- 关于功放引脚4脚和6脚:可以根据喇叭的功率来选择相应功率的功放,比如5W以内喇叭可以选择单声道功放XPT8871、LTK5128,15W的喇叭可以选择TDA7297等双声道功放;
- 关于语音识别:只有使用语音识别功能的时候才需要接咪头(如:9767型咪头),且只能识别芯片指定的30条命令词;
- 通过模块板子上的拨码开关选择波特率,如拨到"√XX√"表示9600,模块的通讯比特率要跟上位机或者与之相连的单片机的比特率一致;
- 3.3V供电。
语音播报功能的代码实现
1. 串口初始化
参考网文:
STM32F103 串口的使用方法
uart2_init
通过拨码开关设置波特率为:115200
2. 工作状态指示输出引脚初始化
/BSY引脚用于指示当前的工作状态,低电平代表Ready状态,高电平代表Busy状态。
用单片机的一个GPIO与之相连,可以读取该IO的输入状态,即可获取当前模块处于的工作状态。
#define U5152_BSY GPIO_ReadInputDataBit(GPIOA,GPIO_Pin_0)
3. 封装播报语音函数
控制标识需要按照语音合成命令的格式发送,控制标记作为文本进行合成,即合成命令是“帧头 + 数据区长度 + 合成命令字 + 文本编码格式 + 控制标记文本”的格式。
语音合成命令帧示例:
/***********************************************************
4. 播报当前时间语音
while
5. 文本控制标记
XFS5152CE 芯片的语音合成功能支持多种文本控制标记,可以满足用户对语音合成发音人、音量、语速、语调等的设置。 文本控制标记的格式一般是半角中括号(即“[]”)内一个小写字母、一个阿拉伯数字,如: [m3]为使用女声的发音人小燕。
文本控制标记举例
sprintf
[v5]:代表音量值,有效范围为:0~10;
[s5]:为语速值,取值范围为:0~10;
[m3]:选择发音人为小燕(女声)
总结
- 模块优点,文字转语音很方便,很灵活
- 价格较贵,所以我们很多情况不需要功能这么强大的TTS语音模块,有些场景,我们甚至没有必要购买TTS语音模块,比如语音开发中常见的费用催缴,拨通后播放:“尊敬的客户,您本月的费用是:212元”,前面部分对所有客户都一样,录一个语音文件就是了,而数字的合成是很简单的,你只要录制好10个数字语音,再加上十,百,千,万,再加上金钱的单位“元”即可。
资料获取
微信公众号后台回复“XFS5152CE语音合成模块”,可以下载模块相关资料。
推荐阅读:
STM32F103 串口的使用方法
LD3320语音识别模块:LDV7模块使用详解
简单好用的ISD1820语音录放芯片
从六月份开始,每个月会制作一个毕业设计难度的DIY作品,
前期作品以模块组合的形式搭建,降低门槛,方便大家一起跟着做;DIY过程只在微信公众号中分享,大家没关注的,赶紧关注哈。
每个月时间大致安排:
- 上个月25号,公布DIY作品名称;
- 每月1日公布作品功能点及所需要的功能模块链接;
- 每月10日前绘制完模块配合的线路板;
- 每月15日之前硬件搭建完毕,之后按模块撰写代码,调试,随时公众号更新进展;
- 每月月底开源整个作品的源码和PCB工程文件。
题目选取原则:
- 公众号每个月20日发起投票,25号截止,票数最多的作为下个月的DIY内容;
- 投票的备选项大家可以后台留言给我,我会选出五种留言最多的作为选项;
- 每个月的DIY内容尽量与上个月分享的文章有一定的相关度,起到温故知新的作用。
有什么想法或者建议,后台留言给我哈。
喜欢请关注微信公众号:嵌入式从0到1
<br> (二维码自动识别)
公众号内容面向在校大学生、电子爱好者、嵌入式工程师;
涉及电子制作、模块使用、单片机技术、物联网相关知识分享;
玩模块,学硬件,带你从0走到1
若觉得本次分享的文章对您有帮助,随手点赞并转发分享,也是对我的支持。
最后
以上就是高兴白昼为你收集整理的小米tts语音引擎下载_TTS语音模块:XFS5152CE语音合成模块详解的全部内容,希望文章能够帮你解决小米tts语音引擎下载_TTS语音模块:XFS5152CE语音合成模块详解所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复