Sora (人工智能模型)

本頁使用了標題或全文手工轉換
維基百科,自由的百科全書
Sora
Sora生成的女子在東京街道上行走的視頻
開發者OpenAI
首次發布2024年2月15日,​2個月前​(2024-02-15
平台OpenAI
網站openai.com/sora 編輯維基數據

Sora是一個能以文本描述生成視頻的人工智能模型,由美國人工智能研究機構OpenAI開發。[1]

Sora這一名稱源於日文「空」(そら sora),即天空之意,以示其無限的創造潛力。[1]其背後的技術是在OpenAI的文本到圖像生成模型DALL-E基礎上開發而成的。[2]模型的訓練數據既包含公開可用的視頻,也包括了專為訓練目的而獲授權的版權視頻,但OpenAI沒有公開訓練數據的具體數量與確切來源。[1]

OpenAI於2024年2月15日向公眾展示了由Sora生成的多個高清視頻,稱該模型能夠生成長達一分鐘的視頻。[2]同時,OpenAI也承認了該技術的一些缺點,包括在模擬複雜物理現象方面的困難。[3]麻省理工科技評論》的報道稱演示視頻令人印象深刻,但指出它們可能是經精心挑選的,並不一定能代表Sora生成視頻的普遍水準。[2]

由於擔心Sora可能被濫用,OpenAI表示目前沒有計劃向公眾發布該模型,而是給予小部分研究人員有限的訪問權限,以理解模型的潛在危害。[1][2]Sora生成的視頻帶有C2PA元數據標籤,以表示它們是由人工智能模型生成的。[1]OpenAI還與一小群創意專業人士分享了Sora,以獲取對其實用性的反饋。[1]

參見


參考文獻

  1. ^ 1.0 1.1 1.2 1.3 1.4 1.5 Cade Metz. OpenAI Unveils A.I. That Instantly Generates Eye-Popping Videos. The New York Times. 2024-02-15. 
  2. ^ 2.0 2.1 2.2 2.3 Will Douglas Heaven. OpenAI teases an amazing new generative video model called Sora. MIT Technology Review. 2024-02-15. 
  3. ^ Antonio Pequeño IV. OpenAI Reveals ‘Sora’: AI Video Model Capable Of Realistic Text-To-Video Prompts. Forbes. 2024-02-15. 

外部連結