20多年前,我逃課去看《黑客帝國》。
墨菲斯說:歡迎來到現實世界。
我從夢中醒來,回到教室時,老師正在講國有企業改制過程中的頂層設計。
你所看到的是真實的嗎?
時光荏苒,我終於忘了很多人,也終於忘了很多事情。
當我醒來時,AI圈沸騰了,大家發現現實已經不復存在了。
OpenAI 發布了乙個大型模型的預告片,能夠生成 60 秒的完整模型。
這個大模型稱為 sora。
作為 AI 工具的重度使用者,我平均每天使用生成式 AI 和 AI 繪畫工具的時間超過 2 小時。
Sora 最感興趣的一件事是它生成的影象不會摺疊或閃爍。
其實現階段開源的AI繪畫工具也可以生成**,但大部分都在4秒以內,最大的缺點就是臉部塌陷和閃爍。
臉部塌陷的原因是很多大模特很難處理大畫面的面部細節,而閃爍的原因是在這個階段,大模特是一幀一幀地生成,然後拼湊起來**,每一幀的細節都會有變化。
從這個角度來看,在Sora面前,現在所有的**大模特都要跪下。
一些分析人士認為,SORA使用遊戲引擎。 我同意這個觀點,使用遊戲引擎可以巧妙地繞過生成逐幀影象然後將它們拼接在一起的缺點。
英偉達(Nvidia)的資深科學家吉姆·範(Jim Fan)對Sora有一些自己的看法:
SORA是乙個資料驅動的物理引擎。 它是對許多世界的模擬,包括真實的和虛構的。 模擬器通過去噪和梯度學習來學習複雜的渲染、直觀的物理、長期推理和語義理解。
如果Sora使用虛幻引擎5進行大量合成資料訓練,我不會感到驚訝。 一定是這樣!
在 chatgpt3 中5 在上線之前,ChatGPT發布了幾個版本,雖然效能驚人,但能力有限,也不溫不火。 3.在 5 大受歡迎後,它不懈努力推出付費 4版本 0。
再厲害,ChatGPT至少有乙個“前奏”,它的基本原理和執行邏輯,還有進步,對AI感興趣的人都有了解。
SORA的出現有點措手不及,就在昨天,大家還在為ai**閃爍的問題絞盡腦汁,畢竟大家都看到了基於現有技術水平的**,知道瓶頸是**,知道上限是**。 Sora就像跳出人類科技,天力時科技的突然到來。
但! 如果你使用的是虛幻引擎 5 這樣的遊戲引擎,所有這些都是可以理解的。 只能說之前的AI**走的是AI畫的老路,**=畫是一幀一幀疊加是理所當然的,而Sora巧妙地改變了路線,這仍然是ChatGPT的邏輯,用資料驅動遊戲引擎,然後遊戲引擎生成畫面。
這樣的技術並沒有超越現在的技術水平,只是乙個骨頭上的驚喜,這是以前沒有人真正想象過的。
ChatGPT首先將接收到的文字轉換為**,然後使用**驅動遊戲引擎生成圖片。
隨著SORA的成功,未來將有越來越多的AI大型模型接入遊戲引擎,這將導致現有大型繪畫模型的降維!
至於**行業和傳統影視行業,則有著深遠的影響。
今年春晚任素喜的歌曲《枕頭上有光的她》,有一段陶瓷小人跳舞的場景,是用AI繪製的。
它具有穩定的擴散 + controlnet + animatediff + lcm + ipadapter,基於 sd15。
好在,今年的春節來得早!
如果是幾天後,隨著生成式AI和遊戲引擎技術的快速迭代增長,就連任素汐自己也能用AI畫出來!
不過,根據 OpenAI 的尿液,它很有可能不會開源,但隨著路線圖的建立,其他 AI 公司快速跟上並不難。
最大的壓力可能是 Midjourney,當生成式 AI + 遊戲引擎成為標準時,它變得更加難以轉型。
可以說,不做AI大模型的電影公司就得死了。