主页

索引

模块索引

搜索页面

智能音箱

主要涉及技术:

1. 拾音:
    通过麦克风获取你的语音
    麦克风阵列(Mic Array)

2. 前端信号处理:
    处理技术包括:

      a) 回声消除(Acoustic Echo Cancellaction, AEC)
      b) 噪音抑制(Noise Suppression,NS)
      c) 语音检测(Voice Activity Detection,VAD)
      d) 声源定位(Direction of Arrival estimation,DOA)
      e) 波束成型(Beamforming)
      f) 混响消除(Speech Dereverberation)

3. 语音唤醒:
    语音唤醒(Keyword Spotting,KWS)

4. 语音识别:
    语音识别(Automatic Speech Recognition,ASR)
    主要完成的任务是将语音转换成文本,所以也被称为 STT(Speech to Text)

5. 自然语言理解:
    自然语言生成(Natural Language Generation,NLG),就是将各种技能的响应结果组织成文本语言
    自然语言生成和自然语言理解都属于自然语言处理(Natural Language Processing,NLP)的范畴

6. 语音合成:
    语音合成(Speech Synthesis),就是将自然语言生成的文本转换为语音的形式,
      提供给智能音箱播放出来,给人的感觉就像和音箱在对话
    因此,这个过程也叫做 TTS(Text to Speech)。
https://img.zhaoweiguo.com/knowledge/images/iots/mic_array.png

Amazon Echo 由 7 个麦克风组成的阵列(绿色圆圈部分)

https://img.zhaoweiguo.com/knowledge/images/iots/mic_array2.jpeg

提高语音识别的准确率的处理技术

主页

索引

模块索引

搜索页面