溫清源。 編輯:程默。
* 10,000 點研究。
天空中沒有翅膀的痕跡,但我已經飛過了。 泰戈爾的名言,恰恰可以形容OpenAI的**生成模型SORA(日語“天空”發音)對**領域的驚人影響。
在SORA的簡報下,被譽為“生成式AI硬體霸主”的英偉達市值已突破2萬億美元大關,其創始人黃仁勳成為人類科技發展的頂級布道者。 而就在十幾個月前,受到加密貨幣泡沫破滅打擊的英偉達股價暴跌了60%,《經濟學人》雜誌甚至落入了陷阱:“當他透過眼鏡看著他認為會改變人工智慧面貌的花哨新模型,以及元宇宙等更模糊的概念時, 有沒有一種危險,他會低估此時此地的殘酷性? ”
在一系列令人眼花繚亂的生成式人工智慧技術**問世之際,投資者對生成式人工智慧的未來越來越感到興奮。
事實上,早在四分之一個世紀前,技術奇點理論的布道者雷·庫茲韋爾(Ray Kurzweil)在他的代表作《靈魂機器時代》中,就對“大規模並行神經網路計算機”的發展充滿期待,而**2020年左右,在這個算力基礎的支援下,人工智慧技術將實現一些里程碑:
絕大多數業務交易場景都包含虛擬人;
大多數道路都配備了自動駕駛系統;
人們開始將機械人作為伴侶、老師、照顧者甚至戀人;
虛擬藝術家出現在各種藝術領域;
* 據廣泛報道,計算機已經通過了圖靈測試,儘管這些測試尚未達到專家批准的標準。
在經歷了 20 多年的興奮和失望之後,OpenAI 的崛起似乎已經讓我們趕上了未來科學界所描繪的進步里程碑。
低調的深度學習教父傑弗里·辛頓(Geoffrey Hinton)也對生成式人工智慧的技術意義讚不絕口:“人工智慧對世界的改變比人類歷史上任何事情都大,在規模上可以與工業革命相媲美,或者車輪和電力的發明。 ("ai is going to change the world more than anything in the history of humanity.”)
的確,即使他們不能說出像Hinton或Huang這樣的大牌的金句,普通大眾也不難從ChatGPT和Sora的病毒式傳播中醒來,並意識到正在發生重大變化。 如果說2016年的Alphago人機大戰完成了人工智慧“有用性”的普及,那麼現在越來越火爆的AI模型,也算是“易用性”的鮮明論證。
聲稱SORA代表了OpenAI的底層模型具備了識別和理解現實世界的能力,AI足以生成自己的開放世界,並在這個世界中自我互動和進化,通往通用人工智慧(AGI)的道路已經完成。
不過,過濾掉李一舟式的“馬上土法”玩家,圍繞生成式AI的解釋已經用盡,卻能真正解釋“有什麼用? 它有多大用處? 這些本質問題仍然沒有明確的答案,事實上,已經打磨出來的技術和業務演進的故事已經非常接近了許多關鍵的里程碑並不是事先存在於技術天才的腦海中,而是研究界在工程實踐中相互啟發的共識的結果,或者它們只是由神經網路模型自己“湧現”出來的"特性。
人們不知道他們想要什麼,直到你把它展示在你眼前“,史蒂夫賈伯斯的這句名言既適用於創新的受眾,也適用於創新的主題。
以 OpenAI 為例,其 GPT 模型的效能“浮現”,是一次工程探索中模型引數數量提公升帶來的“意外”,至於 SORA 展現的幀間一致性和物件一致性,專案開發者 Tim Brooks 也承認,這是一種沒有提前設定的能力, 從所謂的擴散變壓器工程原理來看,SORA或許談不上“世界模型”,按照Yann Lecun對世界模型的描述,其中真實物理世界的直覺“常識”是必要的,顯然與擅長近似隱含概率分布的傳統神經網路路徑格格不入, 而這種驚人的效果可能只能證明SORA已經學會了物理定律的概率分布,而不是物理定律本身。
從技術路線的角度來看,Sora仍然沒有證明或證偽乙個極其重要的問題:面對神經網路的“黑匣子”,劇烈提公升複雜性的縮放定律是通往AGI的可行路徑,還是唾手可得的果實被摘下並餵飽後的甜蜜幻覺?
如果答案是前者,那麼毫無疑問,美國已經牢牢捏住了所有導致AGI的關鍵晶元,從以英偉達為代表的基礎設施**,到OpenAI、谷歌等大型模型開發商,其相對於海外競爭對手的優勢令人驚嘆,而其對主要競爭對手中國的反覆打壓,也表明了美國人主動捍衛這一優勢的決心, 但在美國,AI產業“贏得高光時刻”,或許有必要同時記住乙個冰冷的定律:命運的饋贈往往同時包含著代價。
在埃森哲之前進行的一項關於生成式人工智慧對人類工作影響的研究中,銀行、保險和軟體位列風險敞口最高的前三大行業之列,眾所周知,這些是當前美國經濟的高階支柱。
如果答案是後者,那麼人工智慧史上第乙個大低谷的判斷也可以無縫地挪用到今天:“第乙個爬樹的人可以說這是飛向月球的顯著進步”。
在縮放定律邊際效應遞減的情況下,大語言和寫作模型的應用能否克服間歇性幻覺和災難性遺忘,避免輸出類似前段時間“動車組列車溫度達到1538”的笑話?
以SORA為例,其應用前景能否指向所謂的“一句話生成一部電影”? 從目前的推測來看,如果模型不能實現連續的提示修正,而只能依靠提示反覆嘗試擲骰子的效果,那麼它在影象製作場景中的應用仍將是曇花一現,哪怕是短期廣告製作,其細分市場規模能否支撐目前不低於10萬億美元的生成式AI概念?
無論如何,值得強調的是,自工業革命開始以來,今天公眾對SORA的熱情已經重複了很多次,每次都認為自動化帶來的人類社會新時代只是一箭之遙。 看看控制論之父維納在1950年的著作《人類的有用性》中討論的機器取代人類的可能性及其影響,以及它與今天的**主題有多麼相似:“從這個階段開始,所有的工作都可以由機器完成。 這種機械化的方法也適用於工業企業圖書館和檔案館的絕大多數工作。 換句話說,機器對體力勞動形式的體力勞動或文書工作沒有偏好。 因此,新的工業革命將能夠滲透到廣泛的領域,包括執行所有不需要太多大腦的任務。 新工業革命是一把雙刃劍,它可以用來造福人類,也可以用來毀滅人類,如果我們不明智地使用它,它可能會發展到非常快的地步。 “
當然,如今的ChatGPT、SORA甚至更早的AlphaGo,雖然對大眾的感知影響是明顯而深刻的,但對於任何乙個切換到生產者視角的普通人來說,不難立刻明白,他們的能力和場景與生產力工具的要求之間還有很深的差距, 激發了公眾的好奇心,只是從技術可能性到商業變革的長征的第一步。
讓時間來證明答案也許是最明智的態度。
毋庸置疑,現在的AI狂潮堪比千年網際網絡泡沫,當時狂熱的投資者和創業者也願意在沒有明確應用場景的情況下,把一切都放在想象中的變化願景上,而泡沫破滅後不久,亞馬遜在2001年聖誕購物季扭虧為盈,標誌著網際網絡經濟找到了方向感。
一次又一次,人們因為看到高峰而出發,又因尋找路徑而望而卻步,直到在低谷和邊緣,工程和應用創新的重大突破自下而上點燃,歷史脈絡總是那麼簡潔深刻。
以史為例,生成式人工智慧的產業化之路可能還是這樣,前行迷茫,後看清晰。 在各大平台巨頭的AI算力和AI模型的“軍備競賽”完成後,OpenAI甚至英偉達的資本泡沫或許都無法逃脫清朝的命運,搶緊抓住時機套現價值,這或許是前者精心包裝SORA做公關的用意, 但這個行業的興奮可能要等到泡沫破滅才能真正上演。
庫茲韋爾的另乙個預測可以作為本文的結論和期望:“考慮到所有這些因素,可以合理地估計,到2020年左右,一台價值1000美元的個人電腦在計算速度和容量方面將與人腦相當,特別是在神經連線(人腦的主要計算模式)方面。