智能语音交互是怎么实现交互流程中的输入输出呢?
小爱同学是小米公司于2017年7月26日发布的收款人工智能(AI)音箱的唤醒词及二次元人物形象。
小爱同学一经推入市场便受万千宠爱,网络上关于小爱同学的使用体验各式各样,无不是在称赞,他们对小爱同学的功能、特点无不熟悉,但是你知道小爱同学是怎么工作的吗?
智能语音交互是人工智能的分支,相当于语音助手,属于一款智能型的手机应用,通过智能对话与即时问答的智能交互,实现帮助用户解决问题的功能。
说起智能语音助手大家首先想起的是哪些呢?
1. Siri
苹果iOS系统中的人工智能助手软件
2. Cortana
微软开发的全球第一款人工智能助手,中文名小娜,横跨手机与PC两大平台。
3. Alexa
亚马逊推出的语音助手,主要搭载在Amazon Fcho智能音箱上。
智能语音交互是怎么实现交互流程中的输入输出呢?
智能语音交互界面事实上包含了三个技术环节:
1. 语音识别(ASR)
将人类的语音中的词汇转换为计算机可读的输入,一般包括了信号处理,尽可能的降低环境噪声、信道、说话人等因素对特征造成的影响。
用户根据系统设计的口令密码与系统进行沟通。
比如:小爱同学的操作执行,每次发出指令的模式必须是“小爱同学+工作任务”,小爱同学接收后在把语音转化成文字,再结合文字做出指令回复。
2. 语义处理(NLP)。