语音芯片分类前言:可能很多用户还不了解语音技术现在发展的情况,认为语音的方案还是停留在曾经经典的VS1003系列芯片,以及早期的ISD芯片,可是技术发展这么多年,这些复杂并且昂贵的方案早就已经更新很多代了,推陈出新的是成本更低、性能更加优秀的方案,使用简单、成本低廉、稳定性高才是现在所追求的产品。
目前市场上主流的分类如下:(1)、早期的台系OTP语音芯片这些都是曾经最为辉煌的语音芯片,用户数量最大,其中以台系的OTP语音芯片适用范围最为广,包括:汽车的报警器、安防防盗器、楼宇对讲、语音提示器等等,其中的芯片大多数也都是以4位机为主,量大,价格甚至可以做到5毛钱一下,市面上这样的方案依然很多厂家都在做(2)、华邦推出的ISD系列芯片由于华邦的ISD系列芯片在学生这个群体推广得很好,所以市场的用量也是比较大的,但是其单价比较高,这些年也渐渐的被其他的芯片所替代。
另外华邦也渐渐的不怎么推广这些芯片了,所以这个经典的系列也就成了明日黄花,知道的人多,用的人少。
(3)、VS10xx系列芯片谈到这个芯片,就不得不提经典的VS1003了,至今依然在教科书中见到,这个是曾经的辉煌,虽然厂家目前也推出了几款差不多,功能也相当强悍的芯片,但是知名度却远不如VS1003,这颗芯片在刚推出时,基本上是属于划时代的产品,让很多需要解码MP3的需求得以满足。
(4)、KT403A以及KT603A芯片相比较上述的方案,这两颗芯片无疑使性价比最高的,虽然音质方面比不上VS10xx系列芯片,但是至少接近了90%。
另外还有一个最大的优点,就是价格不及VS10xx系列的一半。
价格上面虽然比OTP的语音芯片贵,但是音质却比他们好上10倍,并且语音可以任意的更换和重复的烧录。
控制方式也是极其的明了,大大减少了用户的开发周期。
下面我们做了详细的比较,供用户们来查阅PTUF1FS是一个提供串口的语音模块,完美的集成了MP3、WAV的硬解码。
同时软件支持工业级别的串口通信协议,以SPIFLASH、TF卡或者U盘作为存储介质,用户可以灵活的选用其中的任何一种设备作为语音的存储介质。
通过简单的串口指令即可完成播放指定的语音,以及如何播放语音等功能,无需繁琐的底层操作,使用方便,稳定可靠是此款产品的最大特点。
无需任何烧录器,无需任何软件,USB直接烧写FLASH。
同时可以以SPIFLASH为存储介质的U盘功能,后面章节详细说明1.2功能3.支持采样率(KHz):8/11.025/12/16/22.05/24/32/44.1/482、24位DAC输出,动态范围支持90dB,信噪比支持85dB3、最大支持16M字节的SPIFLASH。
例如W25Q16[2M字节]、W25Q128[16M字节]4、多种控制模式,并口控制模式、串口模式、AD按键控制模式5、Miniusb接口更新语音文件,无需安装任何软件。
支持XP和WIN7系统。
6、支持组合播放功能,可以实现报时、报温度,在一定程度上可以替代一些昂贵的TTS方案7、30级音量可调,5级EQ可调[此功能暂不开放]8、自带3W的功放,直接外接喇叭即可完成放音9、支持6段语音的触发播放,IO检测的方式,所以适合碳膜按键等等场合10、可以同时支持U盘、TF卡以及SPIFLASH作为存储介质1.3应用1、车载导航语音播报2、公路运输稽查、收费站语音提示;3、火车站、汽车站安全检查语音提示;4、电力、通信、金融营业厅语音提示;5、车辆进、出通道验证语音提示;6、公安边防检查通道语音提示;8、电动观光车安全行驶语音告示;9、机电设备故障自动报警;10、消防语音报警提示;1、方案说明模块选用的是SOC方案,集成了一个16位的MCU,以及一个专门针对音频解码的aDSP,采用硬解码的方式,更加保证了系统的稳定性和音质。
小巧的封装尺寸更加满足嵌入其它产品的需求2.1参数说明名称参数MP3文件格式1、支持所有比特率11172-3和ISO13813-3layer3音频解码2、采样率支持(KHZ):8/11.025/12/16/22.05/24/32/44.1/483、支持Normal、Jazz、Classic、Pop、Rock等音效USB接口 2.0标准UART接口标准串口,TTL电平,波特率可设[用户不可设]输入电压 3.3V-5V[7805后级串一个二极管为最佳]额定电流10MA[静态]低功耗电流<200uA功放功率负载4欧姆,支持3W 尺寸19(长)*21(宽)[单位:mm]工作温度[-40度]--[80度]湿度5%~95%主芯片型号KT603C[SSOP24]2.2管脚说明引脚序引脚名称功能描述备注号1GND地[负极]系统地2RX UART串行数据输入 3.3V的TTL电平3TX UART串行数据输出 3.3V的TTL电平4DR芯片DAC输出右声道5DL芯片DAC输出左声道6SPK2外接单声道喇叭不可超过4欧姆3W 7IO4通用输入输出口48IO3通用输入输出口39IO1通用输入输出口110IO2通用输入输出口211SPK1外接单声道喇叭不可超过4欧姆3W 12BUSY播放状态脚播放时输出低13V3314USB+USB数据线DATA+15USB-USB数据线DATA-16VIN电源输入[正极]最大5.2V备注:模块内置单声道功放。
另外模块第1脚和第16脚都有丝印标注的(1)、用户如果拿一个喇叭对模块进行测试,把喇叭的两个脚分别连接SPK1和SPK2.(2)、DACL和DACR只能推动耳机,是芯片内部自己产品的音频信号,就像电脑的音频接口一样3.串口通讯协议串口作为一种在控制领域常用的通信,我们进行了工业级别的优化,加入的帧的校验、重发、错误处理等措施,大大加强通信的稳定性和可靠性,同时可以在此基础上扩展更加强大的RS485进行组网功能,串口的通信波特率可自行设置,默认为96003.1通讯格式支持异步串口通讯模式,通过串口接受上位机发送的命令通讯标准:9600bps数据位:1校验位:none流控制:none格式:$S VER Len CMD Feedback para1para2checksum$O$S起始位0x7E每条命令反馈均以$开头,即0x7EVER版本版本信息Len len后字节个数校验和不计算在内CMD命令字表示具体的操作,比如播放/暂停等等Feedback命令反馈是否需要反馈信息,1反馈,0不反馈dat参数和前面的len相关联,不限制长度checksum校验和[占两个字节]累加和校验[不计起始位$] $O结束位结束位0xEF举个例子,如果我们指定播放SPIFLASH,就需要发送:7E FF0609000004FF dd EF数据长度为6,这6个字节分别是[FF0609000004]。
不计算起始、结束、和校验。
然后对得到的结果进行累加,再用0减,即“0-checksum=校验数据”。
如果这里不明白,可以参考我们的“QYMxFS 辅助说明文档”。
另外用户也可以直接忽视校验,参考我们的5.3.4章节说明。
3.2通讯指令我们的通讯分为以下两大块⏹控制指令⏹查询芯片的参数以及状态3.2.1控制指令这里是控制芯片如何工作CMD命令对应的功能参数(16位) 0x01下一曲0x02上一曲0x03指定曲目(NUM)详见3.4.10x04音量+0x05音量-0x06指定音量详见3.4.20x07保留保留0x08单曲循环指定曲目播放详见3.4.30x09指定播放设备详见3.4.40x0A进入睡眠--低功耗功耗10MA0x0B唤醒睡眠0x0C模块复位0x0D播放0x0E暂停0x0F指定文件夹文件名播放详见3.4.50x13插播广告详见3.4.60x14单个文件夹支持1000首曲目保留0x15停止插播播放背景音乐0x16停止0x17指定文件夹循环播放详见3.4.70x18指定根目录随机播放详见3.4.80x19对当前播放的曲目设置为循环播放详见3.4.80x1A开启和关闭芯片的DAC输出详见3.4.90x21保留详见3.4.100x25多文件夹插播详见3.4.113.2.2查询指令这里是查询芯片的状态和相关的参数CMD命令详解(查询)对应的功能参数(16位) 0x3C保留0x3D保留0x3E保留0x3F查询在线的设备详见3.5.10x40返回错误,请求重发0x41应答0x42查询当前状态详见3.4.100x43查询当前音量0x44查询当前EQ保留0x45保留该版本保留此功能0x46保留该版本保留此功能0x47查询UDISK文件总数设备的总文件数0x48查询TF文件总数设备的总文件数0x49查询FLASH的总文件数5个文件夹的总文件数0x4B查询UDISK的当前曲目物理顺序0x4C查询TF的当前曲目物理顺序0x4D查询FLASH的当前曲目返回文件夹号和曲目指针0x4E查询指定文件夹的曲目总数详见3.5.30x4F查询当前设备的总文件夹数详见3.5.40x61查询当前文件夹指针仅支持FLASH4.7USB更新语音说明[业内首创功能]我们的模块可以使用手机充电线直接更新语音,方便、灵活。
这里分两种设备⏹USB更新SPIFLASH的语音模式⏹USB更新TF卡内的语音模式其实SPIFLASH和TF卡,在插入USB连接电脑,原则上是一致的,使用的都是MASSSTORAGE 协议。
但是目前技术上面,暂时还没办法实现插上USB连接电脑,同时显示TF卡和SPIFLASH的盘符功能。
这里就分为两种操作,针对芯片说明1、芯片一上电检测到USB连接电脑,则进入SPIFLASH的读卡器功能2、芯片上电没检测到USB连接电脑,进入正常工作模式。
如果有USB连接至电脑,则进入TF卡读卡器模式。
如果此时没有TF卡在线,则还是进入SPIFLASH的盘符模式。
4.7.1USB更新SPIFLASH的语音详细说明我们的模块可以使用手机充电线直接更新语音,方便、灵活。
我们的优势如下⏹可以按照客户的要求,更正下载语音的窗口信息⏹无需安装任何软件,直接更新,也不需要专用下载器⏹对音质无任何压缩和损坏,保证更高的音质体验1、插上我们模块的USB之后,可以以SPIFLASH作为存储介质的U盘,如下图(1)、可以从上图看到FLASH的总容量为15.8M字节。
已经使用的空间为15.4M字节。
虚拟出来的设备的文件系统的为FAT格式。
FAT文件系统占的存储空间为442K(2)、进入设备之后,如下图可以很清晰的看到设备里面的文件,以及文件名称。
可以像操作U盘或者读卡器一样操作FLASH.只是速度会比他们慢。
至于为什么后面会详细解释。
(3)、无论用户使用多大容量的FLASH,我们模块都是支持的,并且内部已经做了自动识别,无需用户操心,用户也仅仅需要根据自己的需求来确定FLASH的容量和型号。