智能音箱¶
主要涉及技术:
1. 拾音:
通过麦克风获取你的语音
麦克风阵列(Mic Array)
2. 前端信号处理:
处理技术包括:
a) 回声消除(Acoustic Echo Cancellaction, AEC)
b) 噪音抑制(Noise Suppression,NS)
c) 语音检测(Voice Activity Detection,VAD)
d) 声源定位(Direction of Arrival estimation,DOA)
e) 波束成型(Beamforming)
f) 混响消除(Speech Dereverberation)
3. 语音唤醒:
语音唤醒(Keyword Spotting,KWS)
4. 语音识别:
语音识别(Automatic Speech Recognition,ASR)
主要完成的任务是将语音转换成文本,所以也被称为 STT(Speech to Text)
5. 自然语言理解:
自然语言生成(Natural Language Generation,NLG),就是将各种技能的响应结果组织成文本语言
自然语言生成和自然语言理解都属于自然语言处理(Natural Language Processing,NLP)的范畴
6. 语音合成:
语音合成(Speech Synthesis),就是将自然语言生成的文本转换为语音的形式,
提供给智能音箱播放出来,给人的感觉就像和音箱在对话
因此,这个过程也叫做 TTS(Text to Speech)。