智能音箱¶

主要涉及技术:
1. 拾音:
    通过麦克风获取你的语音
    麦克风阵列（Mic Array）

2. 前端信号处理:
    处理技术包括:

      a) 回声消除（Acoustic Echo Cancellaction, AEC）
      b) 噪音抑制（Noise Suppression，NS）
      c) 语音检测（Voice Activity Detection，VAD）
      d) 声源定位（Direction of Arrival estimation，DOA）
      e) 波束成型（Beamforming）
      f) 混响消除（Speech Dereverberation）

3. 语音唤醒:
    语音唤醒（Keyword Spotting，KWS）

4. 语音识别:
    语音识别（Automatic Speech Recognition，ASR）
    主要完成的任务是将语音转换成文本，所以也被称为 STT（Speech to Text）

5. 自然语言理解:
    自然语言生成（Natural Language Generation，NLG），就是将各种技能的响应结果组织成文本语言
    自然语言生成和自然语言理解都属于自然语言处理（Natural Language Processing，NLP）的范畴

6. 语音合成:
    语音合成（Speech Synthesis），就是将自然语言生成的文本转换为语音的形式，
      提供给智能音箱播放出来，给人的感觉就像和音箱在对话
    因此，这个过程也叫做 TTS（Text to Speech）。
https://img.zhaoweiguo.com/knowledge/images/iots/mic_array.png — Amazon Echo 由 7 个麦克风组成的阵列（绿色圆圈部分）¶
https://img.zhaoweiguo.com/knowledge/images/iots/mic_array2.jpeg — 提高语音识别的准确率的处理技术¶