公司何時才能趕上 OpenAI? 這個問題,想必是一年多來縈繞在很多讀者心中的迷茫。
如果世界上只有一家公司能趕上OpenAI,谷歌應該是最有前途的玩家。
同為北美AI巨頭的谷歌,擁有與OpenAI相同的AGI目標、世界一流的技術人才、全球財力,甚至OpenAI大模型的核心Transformer架構,都是谷歌原創的。
然而,從2023年到現在,AI領域一直動盪不安,OpenAI永遠領先谷歌一步。 每當谷歌想出乙個“復仇殺手”,想要羞愧時,OpenAI總會搶風頭。
例如,新推出的核彈級多模態大型模型GEMINI 15、只在科技話題榜單上“爆”了幾個小時,沒人關心,因為SORA發射後立即爆火,更搶眼。
毫無疑問,人工智慧領域正在上演世界上最激動人心的《速度與激情》,領先的OpenAI漂亮地獲勝,其次谷歌也輸得不錯。 我發現,他們的處境被龍年春節檔的熱門電影準確把握。
如果說OpenAI是驚豔刺激的“火辣辣”,那麼谷歌就像是《飛天人生2》中的中年賽車手,奮力追逐夢想,鼓起勇氣全力以赴,結果不是勝利,而是大翻車。
誰將獲得AGI賽道終點的聖杯的結果仍然未知,但一年多來,僅僅享受這場長距離比賽的初始階段就非常令人興奮。
谷歌和OpenAI的AI對決,可謂是屢屢失敗,屢屢失敗。 讓我們從這場精彩的“雙英雄競賽”中,來看看北美AI巨頭的整體產業競爭情況。
谷歌三連敗,北美AI巨頭熱情結盟
目前,北美有三家AI巨頭在爭奪AGI通用人工智慧的聖杯:OpenAI、谷歌和Meta。
其中,Meta 走的是開源路線,其大模型系列 LLAMA 是目前全球最活躍的 AI 開源社群。 OpenAI和谷歌在同一條軌道上,主要是構建“閉源”大模型。
雖然OpenAI被嘲笑為“不再開放”,但谷歌員工也大膽告誡“我們和OpenAI沒有護城河”。 但從另乙個角度來看,為了說服使用者付費,閉源業務策略必須提供高質量的模型和不可替代的能力,這也將帶動模型製造商不斷創新,保持競爭優勢,這是AI行業不可或缺的業務力量。
因此,北美AI三巨頭的對抗格局是Meta卷生態、OpenAI和谷歌捲模型。
那麼,當您專注於模型賽道時,比賽呢?
整個2023年,與OpenAI同軌的谷歌,都深嘗到了同儕壓力的滋味。
本次比賽可分為三個階段:
round1.chatgpt vs bard.
毋庸置疑,這是谷歌通過OpenAI的“摘桃子”掀起的一場競賽,從此只能跟著OpenAI一路走下去。
2022 年 11 月,OpenAI 發布 ChatGPT 並一炮而紅,掀起了全球大型語言模型的熱潮。
其中,ChatGPT的基礎技術Transformer是由谷歌推出的,大型語言模型的出現是由谷歌研究員Jason Wei(後來轉投OpenAI)發現的。 利用谷歌的技術搶奪谷歌的人,衝擊谷歌的AI領導地位,OpenAI可謂是“面子輸出”。
谷歌的回應是“憤怒和憤怒”。
2023 年 3 月,Google 緊急發布了 Bard。 但這款機型本身的效能比較弱,上線時功能有限,只支援英文,只針對少數使用者,用ChatGPT根本玩不了。
round2.gpt-4 vs palm2.
有人說谷歌採用了“天極賽馬”的策略,在首款遊戲中就特意發布了乙個相對較弱的機器學習模型吟遊詩人。 這有一定的道理,但每匹受不了OpenAI的馬都是一匹好馬。
OpenAI 很快推出了 GPT-4 的公升級版,並開放了 GPT-4 API,讓谷歌走得更遠。
5 月的 Google IO 2023 發布會,被派出去玩 GPT-4,也是乙個“過渡產品”。 谷歌研究副總裁Zoubin Ghahramani表示,Palm 2 是對早期模型的改進,它只是縮小了谷歌和 OpenAI 在 AI 上的差距,但整體上並沒有超越 GPT-4。
這一輪,谷歌仍然落後。 谷歌顯然意識到了這一點,同時在本次發布會上宣布,正在培養一位Palm的繼任者,名叫Gemini,他押注著數億的淨資產,準備在年底上演一場“王子復仇”。
round3.雙子座家族 vs SORA + GPT-5。
2023年12月底,谷歌Gemini“姍姍來遲”,谷歌最強大、最通用的AI模型,被稱為“復仇殺手”。 在此期間,OpenAI上演了一場“甄嬛回宮”的宮鬥戲,並沒有特別爆款。 谷歌這次能拿回屬於它的一切嗎?
遺憾的是,谷歌一直沒能在AI領域上演“龍王歸來”。
Gemini 的三種尺寸:Nano、Pro 和 Ultra,其中 Gemini Pro 在常識推理任務上落後於 OpenAI 的 GPT 模型,Gemini Ultra 僅比 OpenAI 一年前的產品 GPT-4 領先幾個百分點。 而且,Gemini也被曝光,自稱打敗了GPT-4的多模態**,有後期製作和剪輯元件,用中國模特生成的中文語料庫進行訓練,自稱是文心一言。
谷歌在 Gemini Ultra 發布幾天後推出了多模態大型模型 Gemini 15. 可穩定處理多達100萬個token,創下最長上下文視窗記錄。
這是乙個令人興奮的結果,沒有Sora。
幾個小時後,OpenAI推出文字**代模型SORA以前所未有的**代效能,以及世界模型的產品化,再次驚豔世界,搶走了雙子座1號5個主題,也加強了他們的AI領導地位。 目前,人們傾向於認為OpenAI仍然領先於谷歌。
此前,大家紛紛猜測GPT-5已經差不多被訓練好了,面對的是谷歌目前最強的模型Gemini 15、已經有人在空中喊奧特曼,問他要蓋寶寶多久,要不趕緊放GPT-5。
至此,持續了一年左右的北美AI“天極賽馬”,以谷歌的三連敗而落下帷幕。
agi 的不同路徑,難以飛翔的谷歌
AGI是一場漫長的比賽。 拉長軸來看,谷歌和OpenAI一年的對峙,暫時的成敗,未來可能不多。 有資格進入頂級賽道,這本身就是谷歌人工智慧實力的證明。
比起輸贏的結果,更值得討論的是,谷歌已經成為了一整年的“銷量之王”,為什麼一直被openai甩在後面,跟不上呢?
田記賽馬,輸一次就是戰術失誤,每次輸,或許可以從馬種、馬圈、草料等來源上注意是否已經存在問題。
言歸正傳,谷歌和OpenAI可以說是有著相同的目的和不同的路徑。
同心,雙方均以實現通用人工智慧為目標,摘下AGI的聖杯;
不同的是,雙方選擇的技術路線不同。 OpenAI 使用更通用的語言能力作為實現 AGI 的基礎,因此它採用了對 NLP 領域至關重要的 Transformer 架構,建立了一系列 GPT 模型,這導致了 ChatGPT 的驚豔亮相。
谷歌的情況並非如此。 多年來,谷歌旗下的人工智慧研發機構DeepMind利用強化學習和深度學習來解決各種人工智慧問題,積累了廣泛的技術。 例如,驚天動地的AlphaGo,徹底改變生物學的AlphaFold,以及Transformer等NLP技術。
這相當於兩個車手準備比賽,OpenAI為AGI選擇乙個場地,比如“方程式賽車”,然後以語言為核心開發製造模型,對汽車(模型)的結構、長寬、發動機、氣缸等進行優化(工程)。 另一方面,谷歌的 Deepmind 不確定哪輛車會結束 AGI 比賽,並且有很多技術工具可供使用,因此它製造了方程式賽車、跑車和電單車。
兩條路線之間沒有優缺點。 然而,隨著大型語言模型的“智慧型湧現”,證明了OpenAI選擇的技術路線更有希望實現AGI,而谷歌的Deepmind的技術路線暴露了明顯的短板:
1.方向分散且成本高昂。 在各個技術方向投入的泛創新消耗了大量資金,Deepmind與谷歌母公司Alphabeta在商業化上的矛盾正在加深。 在OpenAI大規模融資加速之際,谷歌正在通過裁員來節省成本,以增加對AI的投資。
2.有太多的選擇需要集中注意力。 谷歌開創了許多技術,但每種技術的重要性和強度也是分散的,到處都是沒有水的井。 最典型的是 Transformer 架構,它是由 Google 發明的,但由 OpenAI 發揚光大。 ChatGPT的出現也是在研究人員在谷歌發現之後,但並沒有被認真對待,在離開OpenAI後繼續前進。
3.著陸很慢,結果太慢了。 谷歌在人工智慧方面也是出了名的保守,導致結果的翻譯效率低下,即使有先進的技術。 一位前谷歌員工曾抱怨說,谷歌的專案一般都是吹噓一段時間,然後什麼都不發布,然後一年後專案就被砍掉了。 這從SORA的爆發中可以看出,谷歌對於用於訓練SORA的擴散模型和文生圖模型有相應的技術儲備和成果,但一直沒能先做出像SORA這樣的產品。
可以看出,由於一開始就押錯了軌道,當大語言模型成為AGI最有潛力的實現路徑時,OpenAI的領先趨勢已經成為一種趨勢。 這個時候,谷歌要回到OpenAI所在的技術軌道上,當然會處於劣勢。
走錯一步,走錯一步的“人生”,站起來就意味著一切
坦率地說,谷歌已經在積極解決問題,包括技術策略選擇錯誤、內部管理效率、人員冗餘、AI技術人才外流等。
去年 4 月,谷歌合併了其兩個 AI “手柄”團隊 Google Brain 和 DeepMind,共同開發 Gemini。 就最終結果而言,雙子座的表現非常出色,1第5版是目前世界上最先進的大型模型之一。 內部資源也嚴重向人工智慧領域傾斜,一些人工智慧人才外流又回到了谷歌。
實際行動表明,谷歌在明確賽道後,追趕OpenAI的決心和速度都處於同一水平。
但持續落後的現實也充分說明了一點:自己的失敗是可怕的,朋友的成功更令人擔憂。
儘管谷歌已經盡力解決自身的短板,並竭盡全力推廣大模型,但還是經不起OpenAI加速做強。
一方面,OpenAI的研發團隊可以說是全力以赴,而谷歌新合併的團隊仍然需要磨合。 SORA的核心研發人員比爾·皮布林斯(Bill Peebles)曾透露,團隊基本上天天不睡覺,一年來都在高強度工作。 Google Brain 和 Deepmind 合併後,很多員工不得不放棄自己熟悉的軟體和原來的專案去開發 Gemini。
此外,相較於谷歌補救性人才招聘,OpenAI吸納了全球頂尖AI人才的動能。 就在2月份,阿爾特曼在社交媒體上公開表示,“所有關鍵資源都已到位,並且非常專注於AGI”,他正在尋找人才。 歸根結底,AI的競爭是人才的競爭,因為AGI中最重要的是智力資源,而頂尖和最優秀的人才也只有那麼多,這也讓人為谷歌能否趕上OpenAI而汗流浹背。
在電影《飛翔人生2》中,主角再次嘗試賽車並翻車後,並沒有繼續在賽場上追求勝利,而是作為乙個熱愛賽車運動的車手,踏上賽道只是為了證明自己。
谷歌與OpenAI的對決不能歸因於簡單的輸贏。 正如谷歌在《我們為什麼關注人工智慧(以及目的)》中所說:我們相信人工智慧可以成為一項基礎技術,它將徹底改變世界各地人們的生活——這就是我們的全部,這就是我們所熱衷的!
所有勇於下場、站在賽道上的AI“賽車手”,都值得掌聲。 而這款充滿速度和激情的 agi 遊戲,一定會給觀眾中的我們帶來更多的震撼。