關鍵詞檢測

維基百科,自由的百科全書

關鍵詞檢測(Spoken keyword spotting或Spoken Term Detection)是語音識別領域的一個子領域,其目的是在語音信號中檢測指定詞語的所有出現位置[1]

主要有以下幾種類型:

  • 無約束語音中的關鍵詞檢測
  • 孤立詞識別

無約束語音中的關檢測檢測主要針對關鍵詞沒有被其他詞分隔,並且在原句中沒有語法信息。以下算法常被用於該目的:

  • 滑動窗口和垃圾模型
  • K最優假設
  • 迭代Viterbi解碼

孤立詞識別主要針對關鍵詞在文本中通過靜音進行分隔。應用到該問題的主要技術手段是動態時間規整英語Dynamic time warping技術。

參考

  1. ^ 存档副本. [2012-12-26]. (原始內容存檔於2013-01-08).