誰能想到OpenAI的王邦會留到這個時候,但從奧特曼迄今為止的表現和公眾態度來看,空是否是最後一張底牌還是未知數。
SORA是由知名AI研究機構OpenAI開發的一款可以從文字描述中生成**的AI模型。
sora這個名字來源於日語中的“sora”,意思是天空,以展示其無限的創造潛力。 其背後的技術是在 OpenAI 的文字到影象生成模型 DALL-E 的基礎上開發的。 該模型的訓練資料包含公開可用的**和授權用於訓練目的的版權****,但 OpenAI 沒有透露訓練資料的確切數量和確切數量**。
在 Sora 之前,該領域已經有其他幾款文生**型號,包括 Meta 的 Make-A-Video、Runwa 的 Gen-2 和谷歌的 Lumière,最後乙個型號於 2024 年 2 月發布,仍處於研究階段。 Sora 的開發公司 OpenAI 於 2023 年 9 月發布了 Dall E 3,這是其 Dall-E 文生圖模型的第三個版本。
SORA背後的技術基於All E 3模型。 根據 OpenAI 的說法,SORA 是一種擴散變壓器——一種使用變壓器作為降噪器的去噪電位擴散模型。 通過對 3D“補丁”進行去噪,它會在潛在空間中生成,然後通過解壓縮器將其轉換為標準空間。 重新生成的標題用於通過在文字轉文字模型上建立詳細的標題來增強訓練資料集。
OpenAI 於 2024 年 2 月 15 日向公眾展示了 SORA 生成的多個 HD**,稱該模型能夠生成長達一分鐘的 **。 同時,OpenAI也承認該技術存在一些缺點,包括難以模擬複雜的物理現象。 《麻省理工科技評論》報道稱,這些演示令人印象深刻,但指出它們可能是經過精心挑選的,並不一定代表SORA生成的一般水平。
由於擔心SORA可能被濫用,OpenAI表示目前沒有計畫向公眾發布該模型,而是讓一小群研究人員有限地了解該模型的潛在危害。 SORA 生成的 ** 使用 C2PA 元資料進行標記,以指示它們是由 AI 模型生成的。 OpenAI 還與一小群創意專業人士分享了 SORA,以獲得有關其實用性的反饋。