Sora模擬未來世界的詮釋

Mondo 科技 更新 2024-02-19

Jim Fan 對 Sora 的評論:

如果有乙個超出我們知識範圍的存在編寫了我們現實世界的模擬**,我們甚至可以嘗試估計該程式的編譯二進位檔案的大小。 以 Meta AI 開發的鴯鶓視訊為例,它有 60 億個引數。 假設有乙個名為 SORA 的系統,其大小是 EMU Video 的 10 倍,並且使用 Bfloat16 格式,那麼這個“建立者”的程式大小可能不會超過 111GB。

但這裡有幾點需要注意:

事實上,這樣的**可能比我們設想的SORA系統要簡單得多,因為SORA距離達到kolmogorov複雜度(一種測量物件資訊量的方法,代表最短的無失真壓縮資料長度)還有很長的路要走;

SORA系統不僅旨在模擬我們所知道的世界,而且能夠涵蓋所有可能的世界。 換句話說,我們所經歷的現實只是SORA能夠模擬的眾多可能性之一;

就像在遊戲設計中一樣,在使用虛幻引擎 5 建立逼真的場景時,你不需要渲染每個細節,而且我們物理世界的某些部分實際上可能並不存在,直到我們看到它。

研究人員的解釋:

1)效果:遠超以往所有文盛**方案,幾乎兩代改進,貼近消費工業生產的需要。內容60s的長度遠遠超過了之前文盛**的10s長度,達到了短**流行款的長度; 極其穩定的鏡頭; 該模型不僅能理解使用者在提示中提出的要求,還能理解這些東西在物理世界中是如何存在的,並實現了大量的物理互動(不僅能生成乙個飽滿流暢的行走和划艇,甚至可以生成乙隻非常逼真的貓踩在熟睡的人身上, 而船在海浪中旋轉,接近物理世界),其他握手和擁抱都不太好。2)能力提公升的根本原因:**尚未發布,OpenAI認為SORA作為擴散模型的能力提公升來自於更多**(甚至可能擁有3D)作為訓練集,準確深入的語言理解能力,以及世界構建能力。從研究人員的角度來看,真正開發SORA的人只有三個人,其餘的都是支援工作,我認為最大的改進可能來自三個主要方面:

擴散變壓器架構。

有可能通過UE5、Unity、Nerf等生成了大量的合成資料作為訓練集。

大型語言模型的改進能力(OpenAI表示,它正在教人工智慧理解和模擬運動中的物理世界,目的是訓練可以幫助人們解決需要現實世界互動的問題的模型)。

3)目前商業化進展:OpenAI尚未公開開放SORA許可權,稱SORA目前只是研究專案的開始,CEO阿爾特曼在Twitter上邀請留言生成**演示能力,並表示OpenAI一直在與安全測試機構、電影和**創作者合作,以改進產品。我認為它將在 6 個月內商業化並正式發布。 4)未來市場展望:2000億美元的空頭市場,3D、遊戲、商業拍攝、特效、IP轉換等內容創作工作流程有望被顛覆,可以提公升使用者體驗,大大降低使用者門檻,大大降低創作成本,大大拓展創作者能力的邊界。我看到了下乙個擁有 1 億使用者的超級應用程式的原型。

轉過來,我連續參加了幾次小會議,也談過索拉。 從長期跟蹤的角度來看,首先是迭代速度太快。 現在 GPT5 還沒出來(在賦能記憶體的過程中),SORA 先出來了,有理由推測是類似量級的產品,未來 3-6 個月可以看到更多。

二是對我們來說,在這種大力創造奇蹟的模式跑完之後,矽谷將進入乙個更加狂熱的算力軍備。 從簡報來看,奧特曼的7萬億刀,就算落地10%,也是23年內整個AI投入的兩倍。 現在英偉達也準備砸錢了,軟硬體、英特爾等也準備跟進。 如果大家都這樣玩,創造奇蹟,那麼相比之下,我們的算力就更短了,不是因為沒有錢,而是因為錢買不到算力。

許多人目光短淺,認為SORA只是改變了電影媒體,不值得害怕。 不,是虛擬與現實之間的界限消失了。 這是已經出來的加特納曲線。 昨天,一位做工業設計的朋友說,他管理著60多人,如果商業用途到位,其中至少有三分之一的人會失去工作。

會議紀要**:溫八沽研究]小程式

隨便投射到生活中,你教育你的兒子,說你學習不好,以後會撿瓶子。 你的兒子可以看到他已經 30 歲了,正在撿瓶子。 你舔狗說,今天我們去世界坐過山車,去國貿中心買東西,去北京看夜景,她都看得見。 你告訴我這只是電影業的問題嗎?

你說的就是你所看到的,這不就是所有人類文明都被騙過的諺語的力量嗎?

關鍵是要快速迭代,在快速迭代的基礎上,我們也要大力發揮,創造奇蹟。 然後我們拿了錢,卻拿不到卡。 這一代拿不來,庫存有點,臨時能趕上35。但是下一代卡呢?

馬斯克也很緊張,他說他FSD有很多資料,從事SORA功能是可以的。 這確實是真的,從資料的角度來看,你**乙個行車資料,是沿途100公里的模型,而且是乙個真實的場景。 有建築物、道路、汽車和紅綠燈。 當然,可惜他只有視覺和公釐波,如果他能加乙個雷射雷達,那麼饋送這些資料的效果會更好。 人工智慧將使物理感知變得更容易。

這些資料也可供我們的車企使用,但問題是馬斯克不僅購買晶元,而且還自己動手。 即使 XAI 在短時間內跟不上 OpenAI,也至少有能力保持代溝。 我們的車企不是說他們沒有太強的融資能力,就算賺了錢,也拿不到算力。 這個時候,車企還是和大廠合作就好了,至少大廠有錢,手裡能擠出一些算力。

它與**無關,沒有什麼可以對映這波浪潮。 當你去媒體時,你居然嘀咕,它真的是負面的嗎? 如果你去光模組什麼的,你怕別人會倒給你。 所以它與**無關。 只是焦慮而已,算力基礎的焦慮確實導致了這樣乙個事實,即無論我們多麼聰明,我們也缺乏大力創造奇蹟的同等基本條件。

這兩天,這個我談了很多,真的和**沒什麼關係,一天也不值得說**。

是焦慮,我深深地感受到了用算盤敲原子彈的祖先的感受。 好不容易鑽出了工業生產能力的老鼠洞,鑽了出來,想著眼前沒有老鼠洞。 嘿,又乙個。 沒有好的辦法,先進的工藝落後了十年,AI以前還不錯,但現在已經拉走了3年左右。 未來5年整體水差能否維持? 我不知道,但我只能繼續鑽,沒有好的辦法,但我想鑽得更快。

會議紀要**:溫八沽研究]小程式

相關問題答案

    未來世界的 12 個軟體開發預測

    人工智慧和機器學習等軟體開發領域的新興趨勢和頻繁變化將統治軟體開發行業的未來。軟體開發趨勢的未來始終是乙個艱難的決定。為什麼?因為軟體開發領域的新興趨勢和頻繁變化總是被期望滿足市場不斷上公升的期望。這些趨勢也將決定軟體開發行業的未來。然而,在各個科技行業領域,有一些關鍵的發展需要考慮和 分析這些未來...

    曾世強對未來世界變化與挑戰的五大預言

    全球矚目的未來趨勢,曾世強的預測引發了熱議。大家好,我是神秘。曾世強,一位畢生致力於中國道教文化研究的文化人,在 百講 專欄對 易經 的深入解讀中備受矚目。近日,網路上突然掀起了一波熱議討論曾世強的 有些人認為它發人深省,另一些人則認為它正在發生。今天,讓我們深入探討這五個流行的預言,它們說了什麼,...

    未來的世界將是安靜的,人工智慧將為我們承擔重任

    人工智慧的設計和開發不是為了取代我們,而是為了讓人工智慧成為一種可以被我們更好地使用的技術。劉潤曾經說過類似的觀點 未來世界會安靜下來,要靠人工智慧來替我們扛起重擔。在不確定的時代,人類要想不被淘汰,就必須依靠終身學習,因為只有學習能力才不會被未來打敗。查理 芒格曾經說過一句名言 我不斷看到生活中的...

    10個產品設計理念,讓未來世界變得更美好

    作者 Custom Industrial Design Network 種創意產品設計,讓未來世界更加閃耀。創意滑鼠設計 這是一款獨特的產品外觀圓滑簡約,線條流暢,手感舒適,使用起來非常方便。更重要的是,這款滑鼠的設計充滿創意,它採用人體工程學設計,適應手部自然姿勢,減少手部疲勞,提高工作效率。同時...

    水瓶座獨立創新,是未來世界的思想家

    在占星術中,水瓶座被認為是乙個獨立和創新的代表。這個星座的人經常表現出對傳統智慧的挑戰和對未來世界的前瞻性願景。水瓶座的獨立性和創新思維在當今社會變革的浪潮中尤為重要,他們的智力貢獻可能會塑造未來的世界面貌。首先,水瓶座的獨立性體現在他們突破和挑戰傳統觀念的能力上。這個星座的人通常不滿足於受傳統社會...