OpenAI 向業界丟擲了一枚重磅炸彈 SORA,引發了科技界極其激烈的意見交流。
圖靈獎得主、Facebook首席AI科學家Yann Lecun公開表示,SORA是乙個生成畫素,無法理解物理世界; 360董事長周弘毅和獵豹CEO傅晟最近幾天也一直在“擂台上”。
在SORA出現後,周弘毅提到了乙個廣為流傳的觀點,他認為SORA的出現意味著AGI(通用人工智慧)的實現將從十年縮短到一兩年。 傅晟在公開場合表示,SORA是產品級的里程碑,但不是AI的技術革命,AGI不會在一年內到來。 兩人在社交平台上展開了激烈的辯論。
OpenCSG創始人陳然認為,SORA是比ChatGPT更重要的里程碑,“在我看來,ChatGPT是一塊墊腳石,為SORA創新做了基礎準備,我認為SORA是下一代的創新。
關於SORA,OpenAI的官方技術檔案沒有給出更多資訊,圍繞其觀點的對抗也沒有最終答案,但OpenAI在年初投下的重磅炸彈有望成為整個2024年討論的焦點,就像ChatGPT之於2023年一樣。
這壺酒足以讓所有人類最聰明的頭腦品嚐一會兒。 復旦大學電腦科學與技術學院教授、上海市資料科學重點實驗室主任肖陽華認為,機器可能會顛覆科學家和哲學家幾千年來對世界的解釋方式。
乙個更重要的里程碑?
SORA的出現,讓蕭陽華既意料之中,又出乎意料。
預計GPT一定會向多模態發展,這是去年年初形成的共識。 出乎意料的是,看到結果,尤其是當涉及到物理世界的模擬時,將顛覆我們已經知道的很多東西。 ”
從理性的角度來看,肖陽華告訴第一財經,OpenAI的進步速度並沒有超出他的預期,因為當ChatGPT出現的時候,很多人都判斷這是人類社會的奇點時刻,一旦跨越這個時刻,未來將是指數級發展,而我們只是在見證指數級發展。 但從情感的角度來看,“我們的受體從來都無法接受只有輕微的線性變化,而SORA的衝擊仍然是乙個巨大的衝擊。 ”
業內分為謹慎和冷靜,樂觀SORA的出現。 早在SORA發布當天,周弘毅就在微博上發長文表達了對SORA的看好,他認為SORA不僅展現出了最好的生產能力,而且在大模型對現實世界有了理解和模擬之後,會帶來新的成就和突破,“這真的離AGI不遠了, 不是10年20年的問題,可能在一兩年內很快就能實現。 ”
傅晟給這股熱度潑了一盆冷水,在他看來,SORA其實是產品上的乙個重大里程碑,但在技術上並不比ChatGPT更大的突破,甚至和AGI也沒有那麼大的關係,是大模型能力的延伸。
陳然並不認為SORA可以模擬物理世界,但他告訴第一財經,OpenAI將Transformer架構和穩定的擴散模型相結合,是一種獨創的新結構,無疑是一次巨大的技術創新,也許是走過這條路更重要的里程碑。 陳然是作為技術人才的大規模模型創業成員,他創立的openCSG專注於開源大規模模型的生態建設,希望能聯動上下游,讓大規模模型、資料集、智慧型體AI(**集)更加民主和公平。
我們現在認識到,ChatGPT的文生文是乙個里程碑式的創新,現在是文生的乙個新的巨大創新**,會讓應用端出現很多變數,這對未來的創業形態和投資形式來說是乙個巨大的變化,比文生文更具革命性。 陳然認為,SORA有技術創新,是乙個不錯的產品,但到目前為止還沒有真正展現出它的威力,它未來的應用可能比ChatGPT更廣泛。
作為投資人,聯想創投董事總經理羅旭認為,相較於去年ChatGPT上線帶來的衝擊,SORA對行業的感官影響類似,但從技術難度上來說,SORA這次會比ChatGPT更高。
主要原因是文字資料可以結構化,但**的資料不是結構化的,體積大,用這樣的資料進行訓練比較困難。 羅旭認為,SORA解決了大量計畫外資料的訓練問題,找到了工程方法,所以之前在行業內的所有嘗試都被粉碎了。
投資者對SORA的關注程度不亞於企業家,在它出現之後,SORA的話題在投資會議的所有討論中都無法迴避。
羅旭告訴第一財經,聯想創投內部會議討論的第一點是,這項技術現在處於什麼樣的狀態,其次,這項技術接下來會帶來什麼?
我們認為現在推出的技術應該處於生成初期,但有些東西在早期就已經驗證過了,比如訓練方法可以解決時間線的連貫性和一致性問題,但多模態模型本身的上限和能力邊界非常高,進一步發展的可能性更大。 羅旭表示,經過內部討論,他對技術做出了這樣的判斷,今年這個領域會有很多發展機會。
隨之而來的問題是,如果文盛發展得像語言模型一樣,它接下來會帶來什麼? 羅旭認為,語言描述是對世界知識的壓縮,語言模型無法壓縮大量的感知資訊和關於物理世界的資訊,但這些資訊比語言更豐富,如果AI能夠被訓練出來,就意味著模型將對物理世界的認知提公升到另乙個層次, 這對它的邏輯判斷和推理非常重要。
我認為這是多模態的開始,是朝著認知方向邁進了一步,但下面能產生多少價值,就看多模態模型在認知世界能起到多大作用了,現在我們看到它更像是乙個生成的工具。 如果你把握好這個方向,你對世界的理解就會更加深刻。 羅旭說。
論戰的背後。 SORA上線後,科技界最有爭議的一點是該模型能否理解物理世界,並在此基礎上推動AGI的快速到來?
在技術文件中,OpenAI 將 SORA 定位為 World Simulators 的生成模型。 “SORA是能夠理解和模擬真實世界模型的基礎,我們相信這種能力將成為實現AGI的乙個重要里程碑。 ”
有人認為,基於其物理相互作用效應,SORA是基於對物理世界的理解而產生的,但很多人認為SORA並不了解物理定律,而只是基於比例訓練來擴充套件影象。
就連圖靈獎得主Yann Lecun(Yann Lecun)也曾多次發表宣告,2月17日,他在社交平台X上表示:澄清乙個“巨大”的誤區,從提示中生成大部分看似現實的**並不表示系統理解物理世界,而生成與因果世界模型大相徑庭**。 他認為,通過生成畫素來構建世界模型的方法注定要失敗。
2月26日,周弘毅發了一條20分鐘的**來駁斥“權威”,他說,“現在最看不起SORA的人是楊麗坤”,雖然他是這個領域的資深人士,但不一定是權威所說的。
SORA可能沒有從現象的研究中總結出公式的規律,但應該已經建立了常識的認知,只有在此基礎上才能還原圖景。 周弘毅認為,SORA的推出宣告了人工智慧的乙個里程碑,不要只看表象,我們一定要看到它背後人工智慧的發展,如果機器不僅懂語言,還學習人類的知識,並隱藏著很多隱藏在人與世界互動過程中的知識和物理規律, 學會理解,那麼它就離真正的AGI不遠了。
此前,傅生公開表示,SORA不會推動AGI的快速到來,這與周弘毅之前的觀點背道而馳。在**中,周弘毅也提到了“小福(傅)同學”,並重申了自己的觀點。
隨後,傅晟模仿周弘義身穿紅裙,拿著手機對著鏡子**,回答“老周在偷偷改變觀念”,他提到的不是SORA是否了解世界,而是SORA是否縮短了AGI的時間,或者是否會對AGI的到來有很大的幫助, 以及SORA是否提高了AI對世界的理解。”
老周同志一上來就說,索拉非常了解這個世界,AGI從10年變成了1年,我想這種觀點一定是錯誤的。 Sora對連續**的理解肯定比以前更強了,但是底層技術沒有革命性的突破,對世界的理解沒有比大型語言模型更好的了。 傅晟說,AI當然要有一定的理解,但就能否再現物理世界而言,他認為隨著時間的推移還是會有偏差的。
學術界也有不少業內人士表明了立場。 上海人工智慧實驗室首席科學家林大華近日在朋友圈發文稱,“這一次,我明確同意顏樂村的觀點。 誠然,SORA是構建中的里程碑式突破。 但是生成逼真的**和掌握物理定律甚至 agi 之間存在著巨大的差距,這是完全不同的事情。 ”
我們對 GPT-4 測試得越多,我們就越覺得人類離 AGI 還很遠。 林大華說。
浙江大學博士生導師趙俊波也公開表示,SORA可能不是世界模式,“我也反對很多自導自演地將這項技術類比到AGI,我們離AGI還很遠。 他說,乙個世界模型需要具備輸出行動的能力,輸出未來**,輸出對當前狀態的判斷。 Sora很可能已經了解了世界如何運作的一些模式,但我們不知道它是否具有上述其他能力。
陳然研究了OpenAI的技術文件,他說,就像大語言模型使用前乙個單詞(token)到下乙個單詞(token)一樣,SORA實際上使用畫素來**並生成下乙個畫素,但是在**模型中,它的基本單位從token變為patch,即畫素塊。
對於曾經製作視覺化模型的公司來說,他們經常基於 Diffusion 進行影象和生成,但 OpenAI 的功勞在於將大型語言模型 Transformer 與 Diffusion 的架構整合在一起,從下乙個 Token 到下乙個補丁,以及新的生成路徑。
對於我們這些從事科技的人來說,我們覺得更震撼的其實不是**的生成,而是在畫素和字元之間做了乙個對接,用補丁代替了傳送錨點中最關鍵的一點,很有新意,語言就是乙個字元,影象也可以用字元來表示法則, 我認為這是一場非常大的革命。陳然說。
陳然認為,未來更大的價值是元宇宙可能會加速,因為影象也有規律,“每一幀,每一**,收集到一定程度,就會生成虛擬世界。 從這個意義上說,這也是SORA比ChatGPT更巨集偉和里程碑的地方。 ”
正視差距。 對於國內大型模型公司來說,GPT-4還沒有趕上,OpenAI又取得了進展。
SORA的出現可能會讓很多人意識到這種差距。 肖陽華說,差距一直存在,我們必須正視差距,要有危機感。 但是,承認差距並不意味著放棄,我們必須迎頭趕上,縮小差距,但我們也必須充分認識到追趕的艱巨性。
從國內來看,趙俊波認為,我們和北美的差距在這個方向上已經拉大了。 “而這一次它與GPT的不同之處在於,如果你想追逐它,你基本上甚至沒有錨點。 Meta 是最有可能開源的參與者,但 V-Jepa 目前正在走一條截然不同的技術路線。 ”
陳然從2022年4月開始做大模型,“我看到大模型和美國的差距越來越大,一方面投資環境越來越差,試錯成本越來越低,二來算力'卡在脖子上', 大模型靠的是資料集、算力、**和生態,其中算力是關鍵點,短時間內沒有辦法解決,這就決定了我們會越走越慢,這相當於美國在高速公路上開車,我們走鄉間小路。 ”
不過,陳然並不悲觀,他認為國內應用層有優勢,大模型開發會有緩衝期。
去年是大模式的第一年,再過三年左右,中國可能就處於驚人階段,與美國的差距越來越大,但我認為不會超過3-5年,最終資本是逐利的,如果這個市場能賺錢, 資本將回流。陳然**,2027年和2028年之後,與美國的差距將開始縮小。
我認為,這個市場最終需要一些像阿里巴巴這樣的公司在人工智慧領域嶄露頭角,需要一些敢於做事、有國際視野的創業者來創造這個市場。 陳然說。
對於國內的追趕,肖陽華認為,我們一般都是盲目追隨更多,真正想了解為什麼要追隨,如何追隨,如何區分競爭。 未來,我們可以積極部署在AGI的其他軌道上,形成優勢,從而在整體戰略上平衡對手。 “從小處看,AI的競爭關係到國家的命運,從大處看,SORA在未來開闢了更廣闊的想象空間,這是整個人類發展的重大機遇,同時也伴隨著重大挑戰。 ”
從投資人的角度來看,羅旭認為,像OpenAI這樣擁有頭部技術模型的公司,能力提公升似乎還沒有達到天花板,而且還在迭代中,速度會比創業公司快,這些公司不僅擁有更豐富的算力等資源,還擁有外界不為人知的工程訓練手段, 這些方法使得培訓成本降低,效率提高,這些創業公司仍在填補和尋求工程方法的經驗。這樣距離就會越來越遠。
國內能不能有像SORA這樣的公司,在羅旭看來,還沒有下結論,SORA的技術方法還沒有完全掌握,從投資的角度來看,它的出現只能說讓大家看到了未來進步的方向。
從去年開始,羅旭就講了很多注重願景的創業公司,但是在SORA出現之後,對國內外同類創業公司的影響更大,因為所採用的技術路線不同。 SORA是否會影響投資者對AI專案的選擇,對文盛**會更加謹慎嗎? 羅旭對這個方向更有信心,因為“它向我們展示了產生**的可能性和可能的正確前進方向”。
去年,我們專注於多模態和發電的方向,而這次SORA多次提高了整個技術能力的上限,我們對未來技術方向實施的可能性更有信心。 羅旭表示,未來會繼續尋找相應的創業者來做這件事,但要趕上SORA可能還是有點困難,投資的時候要控制好預期,對行業進行更深入的研究。