Jim Fan 對 Sora 的評論:
如果有乙個超出我們知識範圍的存在編寫了我們現實世界的模擬**,我們甚至可以嘗試估計該程式的編譯二進位檔案的大小。 以 Meta AI 開發的鴯鶓視訊為例,它有 60 億個引數。 假設有乙個名為 SORA 的系統,其大小是 EMU Video 的 10 倍,並且使用 Bfloat16 格式,那麼這個“建立者”的程式大小可能不會超過 111GB。
但這裡有幾點需要注意:
事實上,這樣的**可能比我們設想的SORA系統要簡單得多,因為SORA距離達到kolmogorov複雜度(一種測量物件資訊量的方法,代表最短的無失真壓縮資料長度)還有很長的路要走;
SORA系統不僅旨在模擬我們所知道的世界,而且能夠涵蓋所有可能的世界。 換句話說,我們所經歷的現實只是SORA能夠模擬的眾多可能性之一;
就像在遊戲設計中一樣,在使用虛幻引擎 5 建立逼真的場景時,你不需要渲染每個細節,而且我們物理世界的某些部分實際上可能並不存在,直到我們看到它。
研究人員的解釋:
1)效果:遠超以往所有文盛**方案,幾乎兩代改進,貼近消費工業生產的需要。內容60s的長度遠遠超過了之前文盛**的10s長度,達到了短**流行款的長度; 極其穩定的鏡頭; 該模型不僅能理解使用者在提示中提出的要求,還能理解這些東西在物理世界中是如何存在的,並實現了大量的物理互動(不僅能生成乙個飽滿流暢的行走和划艇,甚至可以生成乙隻非常逼真的貓踩在熟睡的人身上, 而船在海浪中旋轉,接近物理世界),其他握手和擁抱都不太好。2)能力提公升的根本原因:**尚未發布,OpenAI認為SORA作為擴散模型的能力提公升來自於更多**(甚至可能擁有3D)作為訓練集,準確深入的語言理解能力,以及世界構建能力。從研究人員的角度來看,真正開發SORA的人只有三個人,其餘的都是支援工作,我認為最大的改進可能來自三個主要方面:
擴散變壓器架構。
有可能通過UE5、Unity、Nerf等生成了大量的合成資料作為訓練集。
大型語言模型的改進能力(OpenAI表示,它正在教人工智慧理解和模擬運動中的物理世界,目的是訓練可以幫助人們解決需要現實世界互動的問題的模型)。
3)目前商業化進展:OpenAI尚未公開開放SORA許可權,稱SORA目前只是研究專案的開始,CEO阿爾特曼在Twitter上邀請留言生成**演示能力,並表示OpenAI一直在與安全測試機構、電影和**創作者合作,以改進產品。我認為它將在 6 個月內商業化並正式發布。 4)未來市場展望:2000億美元的空頭市場,3D、遊戲、商業拍攝、特效、IP轉換等內容創作工作流程有望被顛覆,可以提公升使用者體驗,大大降低使用者門檻,大大降低創作成本,大大拓展創作者能力的邊界。我看到了下乙個擁有 1 億使用者的超級應用程式的原型。
轉過來,我連續參加了幾次小會議,也談過索拉。 從長期跟蹤的角度來看,首先是迭代速度太快。 現在 GPT5 還沒出來(在賦能記憶體的過程中),SORA 先出來了,有理由推測是類似量級的產品,未來 3-6 個月可以看到更多。
二是對我們來說,在這種大力創造奇蹟的模式跑完之後,矽谷將進入乙個更加狂熱的算力軍備。 從簡報來看,奧特曼的7萬億刀,就算落地10%,也是23年內整個AI投入的兩倍。 現在英偉達也準備砸錢了,軟硬體、英特爾等也準備跟進。 如果大家都這樣玩,創造奇蹟,那麼相比之下,我們的算力就更短了,不是因為沒有錢,而是因為錢買不到算力。
許多人目光短淺,認為SORA只是改變了電影媒體,不值得害怕。 不,是虛擬與現實之間的界限消失了。 這是已經出來的加特納曲線。 昨天,一位做工業設計的朋友說,他管理著60多人,如果商業用途到位,其中至少有三分之一的人會失去工作。
會議紀要**:溫八沽研究]小程式
隨便投射到生活中,你教育你的兒子,說你學習不好,以後會撿瓶子。 你的兒子可以看到他已經 30 歲了,正在撿瓶子。 你舔狗說,今天我們去世界坐過山車,去國貿中心買東西,去北京看夜景,她都看得見。 你告訴我這只是電影業的問題嗎?
你說的就是你所看到的,這不就是所有人類文明都被騙過的諺語的力量嗎?
關鍵是要快速迭代,在快速迭代的基礎上,我們也要大力發揮,創造奇蹟。 然後我們拿了錢,卻拿不到卡。 這一代拿不來,庫存有點,臨時能趕上35。但是下一代卡呢?
馬斯克也很緊張,他說他FSD有很多資料,從事SORA功能是可以的。 這確實是真的,從資料的角度來看,你**乙個行車資料,是沿途100公里的模型,而且是乙個真實的場景。 有建築物、道路、汽車和紅綠燈。 當然,可惜他只有視覺和公釐波,如果他能加乙個雷射雷達,那麼饋送這些資料的效果會更好。 人工智慧將使物理感知變得更容易。
這些資料也可供我們的車企使用,但問題是馬斯克不僅購買晶元,而且還自己動手。 即使 XAI 在短時間內跟不上 OpenAI,也至少有能力保持代溝。 我們的車企不是說他們沒有太強的融資能力,就算賺了錢,也拿不到算力。 這個時候,車企還是和大廠合作就好了,至少大廠有錢,手裡能擠出一些算力。
它與**無關,沒有什麼可以對映這波浪潮。 當你去媒體時,你居然嘀咕,它真的是負面的嗎? 如果你去光模組什麼的,你怕別人會倒給你。 所以它與**無關。 只是焦慮而已,算力基礎的焦慮確實導致了這樣乙個事實,即無論我們多麼聰明,我們也缺乏大力創造奇蹟的同等基本條件。
這兩天,這個我談了很多,真的和**沒什麼關係,一天也不值得說**。
是焦慮,我深深地感受到了用算盤敲原子彈的祖先的感受。 好不容易鑽出了工業生產能力的老鼠洞,鑽了出來,想著眼前沒有老鼠洞。 嘿,又乙個。 沒有好的辦法,先進的工藝落後了十年,AI以前還不錯,但現在已經拉走了3年左右。 未來5年整體水差能否維持? 我不知道,但我只能繼續鑽,沒有好的辦法,但我想鑽得更快。
會議紀要**:溫八沽研究]小程式