沃爾夫岡·馮·肯佩倫的說話機器

沃爾夫岡·馮·肯佩倫的說話機器是手工操作的語音合成器，由奧匈帝國作家及發明家沃爾夫岡·馮·肯佩倫於1796年開始開發。正是在同一年，他完成了土耳其行棋傀儡的開發，不過土耳其行棋傀儡的開發在六個月內便完成，說話機器卻花費了二十多年開發。經歷了第一個五年的研究中的兩個概念上的「死胡同」之後，肯佩倫的第三個方向最終引導他到了他認為可行的「最終」方案——人類聲道的功能替代模型。

第一個實驗方案

肯佩倫的第一個語音合成實驗只涉及產生類似語音的聲音所需的聲帶的最基本要素：用於為火爐添火的廚房風箱被用作一套肺來供應氣流；從普通風笛中獲取的簧片被用作為聲門，這是聲源中聲音的最初來源。一個單簧管的吹口被作為嘴，儘管它過於僵硬。儘管可以通過將手放在吹口開口處阻止氣流來形成一些額外的發音，這個基本模型只能發出簡單的元音。然而，用於發出大多數輔音所需的鼻音，爆破音和摩擦音的部件不存在。像許多其他早期語音學先驅者一樣，肯佩倫誤以為某些聲音的「更高頻率」是聲門的功能，而不是整個聲帶的共振的功能。所以，他放棄了他的單簧片方案，轉而進行多簧片方案。

第二個實驗方案

第二個設計涉及一個鍵盤，類似於該時期的風琴。肯佩倫在其中配備了一組鍵，每個字母一個。聲音是由普通的波紋管產生的，這些波紋管通過各種管道輸送空氣，並用適當的形狀和障礙物來發出該字母的聲音。通過實驗，他發現簧片的共振長度對於創建某些元音和摩擦音的高頻部分來說並不重要。為了保證字母間的一致性，他將它們全部調諧為同一音高。儘管並不是所有的字母都印證了這一點，但肯佩倫已經擁有發出大部分元音和部分輔音所需的技術，包括爆破音"p"和鼻音"m"，從而可以開始說出音節和較短的單詞。然而，這馬上導致了他第二個方案的主要缺陷：多簧片讓一次發出多個字母的聲音成為可能。在形成音節和單詞的過程中，聲音「疊加」（現在稱為協同發音）使其相對於人聲顯得奇怪，違背了實驗的目的。肯佩倫說：「為了繼續我的實驗，首先，我應該對我要模仿的事物有充分的了解。在我進行實驗時，我必須正式學習語言學，不斷地取法自然。這樣我的說話機器和我的語言學理論會有同等的進步，二者可以相互指導。採用現有的方案，可能發出單獨的字母，但不可能結合起來形成音節。有必要遵循自然，只有一個聲門和一個嘴，所有聲音都通過它們發出，並融合為一。」因此，肯佩倫開始進行他的第三個，也是最後一個方案，這個方案在許多方面「儘可能接近」聲道的生理結構。

第三個實驗方案

第三個實驗方案的裝置類似第一個，它相對第二個在概念上更加接近天然的聲道。和之前一樣，它由一個波紋管、一個簧片和模擬的口(由天然橡膠製成，用於更好地通過手的操縱發出元音)，但又包括一個"咽喉"，附帶着一個"鼻腔"(有完整的兩個"鼻孔"，用於發出"n"和"m")，還有幾個專用於發出"s"和"sh"音的杆和管，一個會干擾的簧片振動並發出"r"音的杆和一個獨立、較小的，能使空氣過簧片時嘴被完全關閉(用於發出"b"音)的波紋管。原本一個特殊的用來模擬擦音"f"的閥門被包括在內，但後來被刪除，因為後來發現同樣的聲音可以通過簡單地關閉所有氣流出口並允許空氣從裂縫中泄漏來產生。同樣，在原本設計中，有一個備用的「口」組件，它包括一個木箱和一對作為嘴唇的百葉窗，木箱內有一個木製、用弦操作的翼狀物作為舌頭。該裝置原本被用來模擬形成塞音如"b"和"d"中口和舌的作用，但後來被刪除，因為肯佩倫發現如果沒有一個合適的」舌頭「，這個機器不可能發出的"t"、"k"、"d"和"g"音。他通過將"t"和"k"音替換成"p"音，"d"和"g"音替換成"b"音(本身只是一個輕微的變化的"p"音)來迴避這一問題。在熟悉單詞組成的語境中，聽眾常常完全忽視發音錯誤（這一現象後來被認知科學領域的研究人員發現）。肯佩倫認為，人們對他的機器的發音錯誤更加忽視，是因為他的機器由於他選用的簧片的頻率和聲帶的共振長度，聲音更像一個年輕的孩子而不是成年人。^[2][3] 第三個實驗方案和以往的大不相同，它能說完整的法語、意大利語、英語 (德語也有可能，但需要更精湛的操作者，因為德語更頻繁地使用的輔音)短語。該裝置的最大限制是波紋管，雖然採用的波紋管的能力是正常人肺臟的六倍，它用盡氣流的速度遠遠超過人肺。因為採用單簧片作為的聲門的聲源，該裝置沒有第二個方案中固有的協同發音問題。但是單簧片同時造成它「說話」只有一種聲調。肯佩倫花費一些時間來嘗試向簧片引入幾種聲調變化的機制，但沒有成效。他決定放棄實驗，等待下一代實驗者來改進。對第三個實驗方案的完善都來自於肯佩倫二十年來對聲帶關於發音的深入研究，語言生產的每一個關鍵的生理要素都被聲學或機械學地研究和模仿。

卓越的貢獻

1804年，在完成並展覽他的說話機器後不久，馮·肯佩倫去世。然而在這之前他出版了一部極其全面地介紹了他過去二十年對語音學的研究的書籍。這本456頁的書題為《Mechanismus der menschlichen Sprache nebst Beschreibung einer sprechenden Maschine》（《人類語言的機制和對說話機器的說明》，出版於1791年），涵蓋了肯佩倫建設說話機器（包括最初的方案）和他對聲帶研究的每一處細節。

1837年，查爾斯·惠斯復原肯佩倫的成果，製成他的說話機器的一個改進的複製品。惠斯通使用過去50年來發展的新技術，能夠進一步分析和綜合組成部分的聲音，從而引發語音學的第二波熱潮。觀賞惠斯通的複製品在一次展覽中的展出後，年輕的亞歷山大·格雷厄姆·貝爾在父親的幫助和鼓勵下建造了自己的說話機器。貝爾的實驗和研究，最終促成了他在1876年發明電話，並徹底改變全球通信。

參考文獻

Von Kempelen, Wolfgang, Mechanismus Der Menschlichen Sprache Nebst Beschreibung Seiner Sprechenden Maschine, Austria: Stuttgart-Bad Cannstatt, 1970.
Dudley, Homer & Tarnoczy, T.H., The Speaking Machine of Wolfgang Von Kempelen. The Journal of the Acoustical Society of America, Vol 22, No 2, March 1950: pp 151-166.
Linggard, R., Electronic Synthesis of Speech, Cambridge: Cambridge University Press, 1985: pp 4-9
Standage, Tom, The Turk: The Life and Times of the Famous Eighteenth-Century Chess-Playing Machine, New York: Walker & Company, 2002: pp 76-81
Rossing, Thomas, et al., The Science of Sound, San Francisco: Addison-Wesley, 2002: p 365

外部連結

Kempelen's speaking machine (1791) （頁面存檔備份，存於互聯網檔案館） at youtube.com（英文）