讓我們談談大型模型領域最近的一些轟動性發展。 你還記得年初我做了什麼嗎? 我列出了大型模型未來的 10 大趨勢,在年底之前,我們看到了其中的幾個成真。 無論是 Gemini、NVIDIA 的 Chat with RTX,還是 OpenAI 最近發布的 Sora,每乙個版本都令人眼前一亮,感覺未來已經到來。
朋友們都很好奇,我怎麼看索拉。 簡而言之,我堅信人工智慧的終極形式AGI(通用人工智慧)指日可待,而且在幾年內。
首先必須要說的是,技術競爭的核心始終是人才的聚集和深耕。 看看 Sora,它的表現遠遠超過其他類似產品也就不足為奇了。 像OpenAI這樣擁有核心技術和強大團隊的公司,自然不容小覷。 有一種觀點認為,有了人工智慧技術,小公司只需要做零星的業務。 但最新的事態發展再次證明,這種觀點是幼稚的。
其次,儘管人工智慧技術發展迅速,但這並不意味著它會一下子顛覆所有行業。 相反,它更有可能激發人們的創造力。 就《空拉》而言,雖然有人擔心它會影響傳統影視製作,但我有不同的看法。 一部優秀的**作品不僅在於畫面的積累,還在於創作題材、精心編排的劇本和對話。 Sora 可能確實是廣告、電影預告片和短片等領域的遊戲規則改變者,但它更有可能成為這些領域創意的強大工具。
讓我們看看中國大型模型的發展。 雖然從表面上看,它似乎接近GPT-35 個級別,但實際上使用 GPT-40 還有很長的路要走。相信OpenAI手裡還有更多尚未揭曉的牌,無論是GPT-5還是其他更先進的技術。 他們知道如何控制節奏並保持領先。
大型語言模型最強大的一點是,它們不僅僅是簡單的資訊填充機器,而是可以深刻理解世界的知識。 SORA的技術突破不僅在於它可以生成**,還在於它可以模擬自然和物理定律,從而真正理解和再現世界。 這一技術進步使SORA不僅可以在二維平面上操縱影象,而且能夠在三維世界中建立符合物理定律的逼真場景,這是大規模模型技術的一大飛躍。
以強大的模型為基礎,結合對人類語言的深刻理解和對世界模型的洞察,我們正處於建立跨領域超級工具的門檻上。 想象一下,大型模型如何在生物醫學、蛋白質工程、基因研究,甚至物理、化學、數學和其他學科中大放異彩,從而帶來前所未有的進步和發現。
SORA的案例,尤其是其模擬物理世界的能力,預示著對機械人和自動駕駛等領域的深遠影響。 傳統的自動駕駛技術專注於感知技術,而忽略了更關鍵的認知層面——基於對世界的深刻理解做出判斷的能力。 正是這種對世界的理解,將使自動駕駛的未來不僅能夠對環境做出機械反應,而且能夠像人類駕駛員一樣做出複雜的判斷和決策。
此外,SORA的成功不僅體現在一流的生產能力上,更重要的是,它標誌著大模型真正理解和模擬現實世界的開始,開啟了人工智慧新成就和突破的大門。
第五點更令人興奮:為了訓練像 Sora 這樣的模型,OpenAI 必須讓它產生大量資料。 結合擴散技術,這一過程將使AI能夠更深入、更全面地了解世界。 一旦人工智慧開始這個世界,從所有電影到 YouTube 和 TikTok 上的內容,它對世界的理解將遠遠超出純文字學習。 因為乙個**中的資訊量已經超過了千字,而**中的資訊量遠遠超過了。 這種技術進步意味著,通用人工智慧(AGI)的實現可能不再是十年或二十年的話題,而是可能在未來一二十年內成為現實。
我們正處於技術創新的時代,人工智慧的每一次進步都在推動我們更接近前所未有的未來。 SORA的案例只是乙個開始,未來還有更多的奇蹟等待探索和實現。