關鍵詞檢測(Spoken keyword spotting或Spoken Term Detection)是語音識別領域的一個子領域,其目的是在語音信號中檢測指定詞語的所有出現位置[1]。
主要有以下幾種類型:
無約束語音中的關檢測檢測主要針對關鍵詞沒有被其他詞分隔,並且在原句中沒有語法信息。以下算法常被用於該目的:
孤立詞識別主要針對關鍵詞在文本中通過靜音進行分隔。應用到該問題的主要技術手段是動態時間規整(英語:Dynamic time warping)技術。