当前位置:文档之家› 语音方案AI人工智能介绍

语音方案AI人工智能介绍


CONTENT
PART ONE
语音交互的趋势
语音时代的到来
语音交互的趋势
2018,战国时代第一年
PART TWO
语音芯片的介绍
语音作为人机交互的手段的时代将到来
语言芯片方案介绍
2018,战国时代第一年
音响方向高集成度趋势
• 国芯
• 全志 • 炬芯
预测:MTK等AP厂商集成
• MTK
•…
白电方向开始有方案
新款的AirPods耳机将支持“HeySiri”的语音激活功 能,用户不必触碰耳机,只需隔空呼喊“HeySiri”, 即可唤醒语音助手并与之实现交互。
PART SIX
对手分析
低功耗市场及白电
面向手机等低功耗市场的友商
2018,战国时代第一年
DSPG公司VT芯片特点:
1. 外部MIC的电源控制上,没有考虑功耗问题。 2. 外部成本较高。
仅支持一个模拟MIC接口(AMIC),并且 DMIC没有到平台Codec的DMIC接口的通路 ,这在使用上是不方便的,需要增加额外的电 路成本,并且这部分成本价格偏贵。 3. 算法灵活度不够。 算法合作方为美国Sensory公司,Sensory公 司算法精简,DSPG能够放得下,国内其他公 司算法就放不进去。算法公司收取额外的 Royalty,价格非常贵(1.5USD)。 4. 整体上不是为远场设计的。 选取的是CEVA TL1 DSP, 性能偏弱 不利于后续扩展。
对于台灯、灯泡等市场该芯片功能太过富裕, 造成功能和成本的浪费。
Appendix
我方产品介绍
解决功耗问题和离线问题
产品路标及目标
2018-2022
• 手机&Wearable市场 • 1mW Trigger功耗 • 支持4 模拟MIC • 支持远场应用 • WLCSP-25 2.0x2.0
• 应用方案能够对于应用 的95%场景满足Trigger 识别功能
该芯片是目前唯一仅能满足手机环境的量产芯片, 客户目前没有选择的余地。
面向白电市场的友商
2018,战国时代第一年
启英泰伦的VT芯片:
1. 内嵌ARM M4F核跑降噪,AEC等算法。 对于算法的生态缺乏了解,目前音频相关的算 法多数是和Tensilica HiFi DSP,CEVA DSP 相互结合的。对第三方算法公司的兼容性较弱
PART FIVE
面向手机市场的第二代语音介绍
开启语音专用芯片时代
面向手机市场的第二代语音介绍
解决性能好与坏的问题
方案的特点为: 1.打破了平台的局限性,可以应用到更广的市场范围 2.整体方案比较省电。可以支持熄屏唤醒。 3.以终端为中心,可实现离线识别。 4. 我司方案支持近/远场唤醒。 终端代表:三星S9+, VIVO NEX,小米6X。
终端代表:小米8,华为mate10
联想手机语音识别的进化(2018-6-6)
平台入口需求
新款的AirPods耳机将支持“HeySiri”的语音激活功 能,用户不必触碰耳机,只需隔空呼喊“HeySiri”, 即可唤醒语音助手并与之实现交互。
华为手机语音识别的进化(2018-6-19)
平台入口需求
新款的AirPods耳机将支持“HeySiri”的语音激活功 能,用户不必触碰耳机,只需隔空呼喊“HeySiri”, 即可唤醒语音助手并与之实现交互。
AI语音芯片:是语音芯片发展的第三个阶段。正好解决了这些问题:(1)集成了专用AI处理器模块( NPU),用以对本地的机器学习算法进行加速;(2)语音AI芯片不但集成CPU、NPU,还集成DSP 信号处理、Wi-Fi/蓝牙等模块;(3)能够实现“端侧”智能,将常用功能由云端转换到本地,可离线 操作并解决用户数据隐私问题。代表芯片是杭州国芯的GX8010。
2. 芯片面积较大9x9mm,功耗没有优势。
3. AEM M4F的内核架构,与终端设备上现有的 CPU功能重叠,但是又无法取代现有终端设备 的CPU/MCU,如机器人,玩具,智能家居, 空调等;同时也会对部分市场造成功能浪费, 如照明,汽车电子等。
该芯片的尺寸和功耗无法面向手机/蓝牙耳机/ 遥控器等市场。
12~1月
1~3月
完成第一轮产品批量出货
专利情况
风口机会只有一次
已经申请的专利
序号 1 2
申请号 201810369009.8 2018208743491
计划申请专利明细
序号 1 2 3 4 5 6
申请号
名称 一种用于变送器调理芯片的通信系统及方法 一种具有语音唤醒功能的装置
名称 VAD低功耗侦听方法 VAD降噪方法 VAD唤醒词SNR增强方法 低功耗Voice ADC设计 集成电路版图版权 软件著作权
专用芯片:是语音芯片发展的第二个阶段,其采用适合做语音处理的CPU,加上多通道麦克风阵列接 口,在语音算法上支持回声消除、噪声抑制、声源定位、语音增强等技术,并兼具运算能力和低功耗 的考量。代表芯片有联发科MT8516、科胜讯CX20924、晶晨半导体A113、瑞芯微RK3036和北京君 正X1000。这类芯片未内置神经网络加速器,AI多借助云端实现。(目前主流的智能音箱方案)
面向手机市场的第一代语音介绍
解决语音有与没有的问题
高通旗舰平台codec
海思旗舰平台codec
方案的特点为: (仅旗舰平台支持语音方案) 1.手机平台本身的限制性:针对每一个功能需要单独收取研发授权费(5万$以上),同时需要收取整机销售额的5% 的整机授权费及小批量试产的生产授权费。限制了客户在其平台上做差异化的可能性。 2.耗电:整机待机时间通常为5毫安时,采用Codec常开侦听,会增加3倍功耗,降低待机时间。一般会在终端上设 置快捷键来启动唤醒功能 3.近场唤醒,不支持远场唤醒。 4.以云端为中心。 5.平台迭代周期如(通用芯片),研发周期一般需要24个月。
• 应用方案能够对于应用 的99%场景满足 Trigger识别功能
• 对于客户交互提供极高 的客户感受
2018
2019
2020
2021
2022
产品开发
如期进行
FPGA及算法可以Demo MPW芯片TO
1~10月
11~12月 MPW芯片测试完成
MPW芯片Alpha客户导入,Full Mask TO, 针对四大行业方案人力准备完成,销售团队到位
三星手机VT进化(2018-3-6)
低功耗需求
小米手机VT进化(2018-4-22)
低功耗需求
新款的AirPods耳机将支持“HeySiri”的语音激活功 能,用户不必触碰耳机,只需隔空呼喊“HeySiri”, 即可唤醒语音助手并与之实现交互。
VIVO手机VT进化(2018-6-12)
低功耗、个性化定制需求
目前大多数算法公司均有第三类芯片的研发计划,主要市场还是面向智能音箱市场。 同期,通用芯片/专用芯片厂商开始升级支持LCD/摄像头等,面向未来智能相框市场。
PART THREE
AP方案介绍
AP方案典型介绍:杭州国芯GX8010
AP+Codec的应用
1. 集成了国芯gxNPU,ARM Cortex A7 CPU,Hifi-4 DSP等多个处理器,其中DSP负责语音信号处 理增强、NPU负责深度学习计算、CPU负责软件运行和应用决策控制等。
• 手机旗舰平台部分支持近场唤醒
语音芯片的介绍
AP+Codec的应用
通用芯片:在智能语音设备早期阶段(2014-2015年),由于芯片研发周期漫长(18-24个月),研 发投入高昂,在终端销量难以支撑芯片规模爆发的情况下,市场均采用通用芯片。是AP芯片/平板芯片 等+Codec芯片/DSP芯片等组合的方式,由Codec芯片进行数模信号的转换,DSP对数字信号进行处 理,包括回声消除、噪声抑制、语音降噪/增强等,最后加入云端的计算支持。代表芯片是联发科 MT8563和全志R16。
2. 支持8通道麦克风接口,支持1080P摄像头输入,图像预处理,MJPEG编码等模块。 3. 功耗0.7W
该方案仅针对智能音箱市场,无法覆盖低功耗市场(智能手机、智能耳机)及对AP无需求的应 用市场(台灯,灯泡,儿童玩具,白电)
PART FOUR
面向手机市场的第一代语音介绍
解决语音有与没有的问题
状态 初审合格 递交
类型 发明 实用新型
状态 计划 计划 计划 计划 计划 计划

类型 发明 发明 发明 发明
THANKS FOR YOUR WATCHING
Lorem Ipsum Dolor Sit Er Elit Lamet, Consectetaur Cillium Adipisicing Pecu, Sed Do Eiusmod Tempor Incididunt Ut Labore Et Dolore Magna Aliqua.
• 启英泰伦
长虹投资背景 单麦克 10米
手机平台集成
• 旗舰平台
高通,海思的旗舰平 台
• 音响方向作为领头羊,集中了众多竞争,逐步往 VT+AP+Soundbar的高集成度方向,对功耗的敏感 要求低(具体分析详见AP方案介绍)
• 白电方向刚开始,但是已经体现出价格高度敏感,芯 片算法二合一的趋势(具体分析详见对手分析2)
• 手机&Wearable市场 • 0.5mW Trigger功耗 • 更强的降噪性能 • 支持4 模拟MIC • 支持远场应用
• 应用方案能够对于应用 的98%场景满足Trigger 识别功能
• 手机&Wearable市场 • 0.5mW Trigger功耗 • 更强的降噪性能 • 支持4 模拟MIC • 支持远场应用 • 低功耗硬件AI语音识别核 • 支持80%离线识别
Voice Trigger芯片及解决方案
相关主题