跳至內容

語音可延伸標記語言

本頁使用了標題或全文手工轉換
聆聽這篇條目
維基百科,自由的百科全書

語音可延伸標記語言(英語:Voice Extensible Markup Language,簡稱VoiceXMLVXML)是於互動式語音回應應用程式建立音頻對話的標準,用於開發音頻及聲音回應應用程式,例如銀行系統及自動客戶服務。來自網頁伺服器超文字標記語言(HTML)被網頁瀏覽器接收後,網頁瀏覽器能對其進行解析並視覺呈現出來,VoiceXML應用程式的開發及部署也類似這方式。VoiceXML文件由語音瀏覽器英語Voice browser解析。於一般的部署架構之下,用戶通常經由公共交換電話網(PSTN)跟語音瀏覽器互動。VoiceXML文件以XML為基礎,是由萬維網聯盟(W3C)開發的標準。

用法

VoiceXML應用程式於各行業及商業領域廣泛使用,包括訂單查詢、包裹追蹤、駕駛方向、緊急通知、喚醒、航班跟蹤、語音存取電子郵件、客戶關係管理、還按原方抓藥、音頻新聞雜誌、語音撥號、房地產資訊和國家目錄援助英語Directory assistance等。 VoiceXML的標籤能指示語音瀏覽器英語Voice browser提供語音合成、自動語音辨識、對話管理和音頻播放。下面是一個VoiceXML文件的例子:

<vxml version="2.0" xmlns="http://www.w3.org/2001/vxml">
  <form>
    <block>
      <prompt>
        Hello world!
      </prompt>
    </block>
  </form>
</vxml>

當一個VoiceXML解析器解析該文件時,「Hello world」字句將以語音合成方式讀出。

通常情況下,HTTP被用作獲取VoiceXML頁面的傳送協定。一些應用程式可能使用靜態的VoiceXML頁面,而依靠動態的VoiceXML作頁面生成的應用程式則需使用應用程式伺服器,例如TomcatWebLogicIISWebSphere英語IBM WebSphere

從歷史上看,VoiceXML的平台供應商以各種不同方式執行其標準,並添加專有產品特點。但是,VoiceXML 2.0標準於2004年3月16日被採納為W3C推薦標準,闡明了大部分的差異之處。VoiceXML討論區為推廣標準用途的產業群,它提供了一個一致性測試英語Conformance testing過程,以證明供應商的執行方式的一致性。

歷史

為了開發一個用於語音對話的標準標記語言,美國電話電報公司IBM朗訊科技摩托羅拉於1999年3月構成了VoiceXML討論區。同年9月,他們於討論區開放會員留言功能,並於2000年3月發佈了VoiceXML 1.0。不久後,他們把標準的控制權移交至W3C[1]其後W3C生產了數個中間版本,並於2004年3月生產了最終推薦階段的VoiceXML 2.0。[2]

基於VoiceXML 2.0的反饋,VoiceXML 2.1頁面存檔備份,存於互聯網檔案館)的新增功能相對較少。VoiceXML 2.1能向下相容VoiceXML 2.0,並於2007年6月達致W3C推薦階段。[3]

將來發展

VoiceXML 3.0頁面存檔備份,存於互聯網檔案館)將會是VoiceXML的下一個主要發行版,包含新的主要特點。它包含一個新的XML狀態圖描述語言,名為SCXML英語SCXML

參考文獻

  1. ^ Introduction. VoiceXML Forum. 2007-11-04 [2015-04-24]. (原始內容存檔於2015-07-04) (英語).  |year=|date=不匹配 (幫助)
  2. ^ W3C recommends VoiceXML 2.0. InfoWorld, Ephraim Schwartz. 2004-03-17 [2015-04-24]. (原始內容存檔於2017-06-27) (英語). 
  3. ^ Voice Extensible Markup Language (VoiceXML) 2.1. World Wide Web Consortium (W3C). [2015-04-24]. (原始內容存檔於2021-05-07) (英語). 

外部連結

參見