繼ChatGPT之後,OpenAI又推出了另一款震驚科技圈的產品——SORA! 今天就讓我們仔細看看吧!
什麼是SORA?
SORA是OpenAI首款**生成模型,通過文字指令,可直接輸出長達60秒**,並包含高度詳細的背景、複雜的多角度鏡頭,以及情感豐富的多個角色,出道是王者炸彈!
SORA建立在過去對DALL·E 和 GPT 模型。它使用 Dall·e 3 的重述提示技術,為視覺訓練資料生成高度描述性的注釋,因此能夠更忠實地遵循使用者的文字指令。
SORA有什麼顛覆性?
生成 ** 的時間長度。 在SORA之前,由於從AI文字到**生成的物理和時空推理的侷限性,目前全行業發布的單個連貫性的最大長度為16秒,行業內一般水平在2-4秒之間。 不過,SORA這次的最大支援時長為60秒,直接跳公升公升級為15次。
相機剪輯和平滑度。 此前,AI生成的**產品都是單次單代,在效果層面,更像是做了乙個**動作。 不過,SORA生成的**,在保持主體一致性的前提下,可以實現多角度鏡頭的無縫切換,整體畫面乾淨流暢,從而達到真正的大片效果。
使用的基礎模型體系結構。 上一代AI**大多是基於“大模型+大資料”的架構,因此很難突破AI錯覺問題,Runway在去年12月也正式提出要搭建通用世界模型。 不過,這一次SORA已經有了世界模型的原型,它的生成是基於對真實物理世界的理解,所以內容更加合乎邏輯和說服力。
讓我們一起來看看一些官方發布,感受一下SORA的魅力吧!
提示:東京在下雪後熙熙攘攘。 鏡頭穿過繁忙的街道,跟隨幾個人享受美麗的雪景,並在附近的攤位購物。 美麗的櫻花花瓣隨著雪花在風中飄揚。
小貼士:一場海上自行車比賽**,讓各種動物以運動員的身份騎自行車,使用無人機射擊視角。
小貼士:一位祖母的網紅主持了一堂自製的餃子烹飪課,背景是帶有電影燈光的質樸的托斯卡納鄉村廚房。
現在可以嘗試一下嗎?
目前,SORA不對外開放,只向專業人士提供極少數測試賬號,門檻非常高。 但也有比較簡單的測試方法,建議感興趣的合作夥伴參考官方示例,寫好**提示詞,開啟某個推送,去找@openai創始人Sam Altman,等待回覆