今年早些時候,OpenAI的崛起似乎預示著谷歌的厄運。 但這家科技巨頭已經平息了其人工智慧研究人員之間的爭吵,並最終憑藉其最新的人工智慧技術Gemini發起了攻勢。 現在,困難的部分開始了。
備受期待的新人工智慧技術 Gemini 的第乙個版本的發布是在一些批評者 **OpenAI 的 ChatGPT 可能擊敗谷歌在搜尋領域的主導地位近一年後發布的。 谷歌的領導層已經成功地讓公司內部的不同派系開始合作應對OpenAI,這與那些認為谷歌變得過於優柔寡斷和官僚主義的人的看法背道而馳。 谷歌在搜尋領域的主導地位仍然完好無損。 此外,谷歌的股價今年大幅上漲。
現在,艱苦的工作開始了。 在接下來的幾個月裡,谷歌將不得不展示如何在不損害搜尋等現有業務的情況下將其人工智慧模型(統稱為雙子座)整合到其產品中。
據知情人士透露,谷歌已將較低階別的 Gemini 整合到 Bard 中,Bard 是谷歌建立的聊天機械人,旨在與 ChatGPT 競爭,但迄今為止使用有限。 未來,谷歌計畫在幾乎所有產品線上使用Gemini,從搜尋引擎到生產力應用程式,以及乙個名為Pixie的AI助手,該助手將僅限於其Pixel裝置。 據一位了解內部討論的人士稱,產品還可能包括可穿戴裝置,例如眼鏡,這些裝置可以利用人工智慧的能力來識別佩戴者看到的內容。 然後,該裝置可以為他們提供建議,例如如何使用工具、解決數學問題或演奏樂器。
谷歌必須同時與監管機構仔細協商,同時完成所有這些工作。 該公司捲入了兩起聯邦反壟斷訴訟,涉及其搜尋引擎和廣告業務的主導地位。 反壟斷組織密切關注谷歌的人工智慧工作,因為這可能是谷歌如何利用其在乙個領域的主導地位來贏得另乙個領域的乙個例子,利用其搜尋索引的資料和數十億使用者的資料來訓練新的人工智慧。
人工智慧的成功對谷歌的雲業務也至關重要,因為這些服務對計算密集型人工智慧模型的需求不斷增長。 Microsoft已經報告稱,其雲業務的增長速度超過了谷歌和亞馬遜。
雖然 ChatGPT 以其對話式 AI 而聞名,但其背後的技術已被證明在商業世界中很有用,其用途包括自動化客戶服務和軟體編碼、快速生成營銷活動以及幫助華爾街公司理解大量資料。 谷歌的問題在於,OpenAI和Microsoft在向消費者和企業銷售這項技術方面已經擁有了很大的先發優勢,這為他們提供了寶貴的資料和反饋,他們可以用來改進產品。
這完全取決於實際效果——人們能夠用它構建什麼。 我們才剛剛開始看到,"Madrona Venture Group的合夥人Jon Turow說。 此前,他曾在亞馬遜網路服務(Amazon Web Services)負責人工智慧產品。 “但我們所看到的是非凡的。 ”
Gemini 是公司 25 年歷史上最重要的嘗試之一。 隨著谷歌步入中年,其核心廣告業務仍然產生巨額利潤,這些利潤為其母公司Alphabet對自動駕駛汽車、健康再保險和生物技術等新業務的一系列押注提供了資金。 然而,這些十年前的賭注都沒有成功。
因此,投資者越來越迫切地要求谷歌領導層削減這 18一家擁有 20,000 名員工的公司的成本導致了今年的大規模裁員,這對員工士氣造成了影響。 員工們正在為新的一年進行更多裁員做準備,儘管目前尚不清楚裁員是針對全體員工還是針對特定團隊。
人工智慧是另乙個賭注,需要公司投入大量資金來支付從人員到硬體的所有費用。 據接近 Gemini 團隊的人士透露,谷歌需要大量投資來防止其 AI 團隊離開,因為 OpenAI 向谷歌的工程師和研究人員提供數百萬美元的薪水**。
谷歌還希望消除這樣一種觀念,即除了從幾十年前的創新中受益之外,它幾乎沒有做出什麼貢獻。 多年來,該公司通過Google Brain和DeepMind兩個獨立的部門在人工智慧研究方面投入了大量資金。 它甚至發明了名為 Transformer 的底層技術,這是 GPT 的核心,GPT 是 OpenAI 建立的一系列 AI 模型。
然而,OpenAI的驚人崛起引發了人們的擔憂,即谷歌可能會像許多其他古老的科技巨頭一樣在科技領域失敗。 據一位直接了解他們討論情況的人士透露,這家曾經笨拙的科技巨頭Microsoft 2 月份將 ChatGPT 納入其 Bing 搜尋引擎,這讓公司內部的高管們感到特別惱火。
谷歌發言人沒有對此事發表評論。
戰鬥實驗室
多年來,谷歌和Alphabet的首席執行官桑達爾·皮查伊(Sundar Pichai)一直向同事抱怨說,他無法讓他的兩個人工智慧研究部門一起工作。 谷歌於2024年收購的Deepmind首席執行官德公尺斯·哈薩比斯(Demis Hassabis)長期以來一直堅持認為,該公司應該獨立於其母公司,這種安排將更好地追求其開發通用人工智慧(類人人工智慧)的目標。
與此同時,Deepmind 的姊妹部門 Google Brain 專注於在 Google 產品中實施的研究,孵化機器學習的重要進展,例如 Transformer,這項發明為谷歌和其他公司訓練更複雜的模型鋪平了道路。 該團隊由傑夫·迪恩(Jeff Dean)領導,他是一位經驗豐富的工程師,他在谷歌的早期編碼工作幫助其搜尋引擎擴充套件到數十億使用者。
這兩個單位之間的分離非常深。 Google Brain 的總部設在加利福尼亞州山景城,這是 Google 的總部,而 Hassabis 和他的團隊則在倫敦國王十字車站附近的總部運營 DeepMind。
隨著 DeepMind 的發展,DeepMind 竭盡全力避免與 Google Brain 合作,例如,據一位曾在 Google Brain 工作過的人說,他們顯然在當時 Google Brain 沒有主要業務的城市開設了辦事處,例如巴黎和艾伯塔省的埃德蒙頓。 DeepMind 的研究人員可以訪問 Google Brain 中寫的 **,但反之則不行,一些員工認為這是 DeepMind 過度保密的標誌,即使在 Google 員工中也是如此。 當哈薩比斯想要採取措施保護Deepmind的獨立性時,他直接與聯合創始人拉里·佩奇(Larry Page)進行了交談,拉里·佩奇(Larry Page)與聯合創始人謝爾蓋·布林(Sergey Brin)一起領導了此次收購並擁有Alphabet的控股權。
一位知情人士表示,隨著時間的推移,哈薩比斯希望將DeepMind與谷歌完全分開,因為他越來越擔心這家龐大的公司將如何使用這項技術,包括將其出售給軍方。 他構思了利用 Deepmind 的智財權建立一家獨立公司的想法。 然而,據一位知情人士透露,在 2021 年,哈薩比斯告訴 DeepMind 員工,與谷歌(他稱之為馬里奧專案)分離的努力已經結束,因為皮查伊承諾為該團隊提供更多資金,包括用於人工智慧倫理。
英國首相裡希·蘇納克(Rishi Sunak)(左)和谷歌的德公尺斯·哈薩比斯(Demis Hassabis)於6月在倫敦。 **由 Carlos Jasso Bloomberg 通過 Getty 提供。
多年來,兩支球隊之間的資源競爭加劇了緊張局勢。 谷歌只有有限數量的伺服器晶元可供其人工智慧研究人員使用。 隨著整個行業人工智慧引發的狂熱增加了對晶元的需求,這些晶元變得更加稀缺。
與此同時,隨著谷歌高管陷入內部政治的泥潭,該公司備受矚目的人工智慧研究人員正在離開。 他們中的一些人成立了自己的公司,對谷歌的官僚文化感到沮喪,這種文化在OpenAI推出其版本之前阻止了類似ChatGPT服務的發布。 其他公司則被OpenAI收購,OpenAI是一家由埃隆·馬斯克(Elon Musk)和其他知名人士於2024年創立的非營利性創業公司,部分原因是擔心谷歌未來會擁有人工智慧。 OpenAI 的創始人之一是 Ilya Sutskever,他是 Google Brain 的關鍵工程師,他領導了諸如建立能夠推理解決以前從未遇到過的問題的人工智慧等進步。
然而,當OpenAI在去年11月發布ChatGPT時,公眾的反應震驚了谷歌。 這家擁有 400 名員工的初創公司在推出聊天機械人方面超過了谷歌,該機械人可以令人信服地回答各種問題,這讓人們對該公司的競爭力提出了質疑。
儘管如此,一些谷歌領導人似乎並不關心這個新的網際網絡寵兒。 一位知情人士表示,在ChatGPT推出幾周後的員工會議上,迪恩在回答有關聊天機械人的問題時表示,谷歌不僅僅是對其他初創公司做出反應。
但在 2 月,Microsoft 宣布將在其 Bing 搜尋引擎中實施 ChatGPT。 一些投資者認為聊天機械人可能會侵蝕谷歌在搜尋領域的主導地位,這讓其高管感到不安。
思想的融合
谷歌需要立即採取行動。
它提出的乙個解決方案是 Bard,它在幾個月內將其拼湊在一起,並在 3 月份發布了這個聊天機械人。 在谷歌內部,這一努力引起了轟動,谷歌知名研究員雅各布·德夫林(Jacob Devlin)在向皮查伊和其他高管提出對谷歌使用ChatGPT資料訓練AI模型的擔憂後離開了公司。 然後他加入了 OpenAI,但僅僅幾個月後,他就因未知原因回到了谷歌。
谷歌的另乙個回應是最終結束 Deepmind 和 Google Brain 之間的內部競爭。 谷歌從這兩個團隊中挑選了研究人員來構建乙個新模型:Gemini,這是乙個由Dean和DeepMind高階研究員Oriol Vinyals領導的專案。 此前,Vinyals 曾在 Brain 與 Dean 合作。
然後,在 4 月,谷歌宣布將合併 Brain 和 Deepmind。 哈薩比斯接管了新實體Google Deepmind,而迪恩則退居谷歌首席科學家一職。 此舉令許多谷歌工程師感到震驚,他們認為鑑於迪恩的成就和在公司的悠久歷史,他應該成為該部門的領導者。
2020 年,谷歌的傑夫·迪恩 (Jeff Dean)。 **由 D**ID Paul Morris Bloomberg 通過 Getty 提供。
領導層試圖將合併作為合併單位的勝利。 Google Brain 研究副總裁 Zoubin Ghahramani 訪問了 DeepMind 在倫敦的辦公室,向員工解釋了重組情況,並在宣布這一變化的那一周的城鎮會議上進行了解釋。 Google Brain為其員工舉行了一次單獨的會議。 哈薩比斯告訴員工,Google Deepmind將匯集世界上最好的兩個人工智慧研究團隊。
但谷歌的人工智慧員工很快意識到,優先事項也在發生變化。 Google Deepmind 的領導層減少了對研究專案的投資,這些專案對構建有競爭力的 AI 產品並不重要。 據這些人說,失去資源的專案包括計畫中的多模型模型Gato的續集,以及乙個名為Genrl的研究團隊,該團隊構建了能夠在虛擬環境中導航的AI系統,例如Atari遊戲。
高管們表示,這些變化還有其他好處:減少重疊工作,減少低優先順序專案,這意味著員工將不再為實驗和研究的晶元使用權而戰。
在山景城,人工智慧員工分散在公司園區的多棟建築中,他們搬進了位於園區核心的一間辦公室,目的是改善研究人員之間的協作。
當OpenAI爆炸性增長的衝擊消退後,谷歌終於有機會反擊。
乙個秘密**
然而,谷歌面臨著乙個巨大的障礙:構建乙個優於 GPT-4 的模型。
從一開始,這意味著研究人員必須在模型開發里程碑的最後期限前完成任務。 據一位了解這項工作的人士稱,員工們日以繼夜地工作,以滿足緊迫的日程安排,這是一種自上而下的方法,與谷歌之前對其研究實驗室的不干預主義方法截然不同。 一位接近該職位的人士表示,對一些人來說,每週工作80小時已經變得很普遍。
即使在公司的人工智慧組織之外,谷歌的員工也有望迅速掌握這項技術。 據兩位知情人士透露,在這一年中,谷歌雲為銷售等非技術角色提供了額外的材料,要求員工通過要求他們參加有關該主題的考試來提高他們對人工智慧的了解。
谷歌的目標是通過使 Gemini 能夠理解各種不同的 **(包括文字、影象、**和音訊)來獲得優於 OpenAI 的優勢,以便 AI 能夠用通俗易懂的英語解釋和解釋複雜圖表的內容。 皮查伊後來表示,Gemini將從頭開始訓練這些型別的資料。 皮查伊很清楚,OpenAI在3月份宣布了類似的影象識別功能,但這些功能最初並沒有被廣泛使用。 這讓谷歌有機會在 OpenAI 之前發布一系列廣泛的多模態功能。
谷歌有乙個秘密:YouTube。 據兩位知情人士透露,谷歌的研究人員嚴重依賴這個屬於谷歌的流媒體服務的資料,包括影象和音訊字幕文字,這對於訓練人工智慧模型至關重要。
這使谷歌能夠訪問比OpenAI和影象生成初創公司Midjourney等競爭對手更豐富的資訊庫。 這也意味著 Google 必須滿足法律部門的要求,例如確保如果 YouTube 使用者刪除**,Google 也會從其模型使用的資料集中刪除該內容。
谷歌的另乙個優勢是計算能力。 與依賴Microsoft伺服器的OpenAI不同,谷歌擁有自己的資料中心。 它甚至構建了自己的專用人工智慧晶元,即張量處理單元(TPU),以更有效地執行其軟體。 對於 Gemini 專案,它已經積累了大量這樣的晶元 - 77,000 *** TPU,代號為 Pufferfish。 在第三季度,谷歌未分配的企業成本,包括在Deepmind上的支出,躍公升了近40%,達到16億美元。
通過與負責專案各個部分的工作人員的日常會議,Gemini的領導層密切關注研究人員的進展。 這些會議在倫敦的員工的一天結束時舉行,山景城的員工在一天的開始時間舉行。 據一位知情人士透露,主持會議的人包括迪恩、維尼亞爾斯和研究副總裁科雷·庫庫奧盧。
谷歌位於加利福尼亞州山景城的總部。 華盛頓郵報通過蓋蒂·梅琳娜·瑪拉
高階管理人員也親自參與其中。 Dean 負責改進軟體,幫助公司的演算法處理大量資料。 聯合創始人布林通常與谷歌保持距離,但與山景城的吉公尺尼研究人員並肩工作,並經常在公司的自助餐廳與他們共進午餐。
在這個過程中,有一些尷尬的時刻。 在 Bard 2 月份的發布演示中,聊天機械人在詹姆斯·韋伯太空望遠鏡上出現了乙個事實錯誤,這讓谷歌在試圖趕上 OpenAI 時感到尷尬。 當這個錯誤被人知道時,谷歌的股價在兩天後上漲了9%。
今年 5 月,谷歌在其年度開發者大會上首次披露了 Jiminny 的存在。 其中一位分析師印象深刻:該公司的股價當天上漲了4%以上。
做好競爭的準備。
在接下來的幾個月裡,谷歌越來越接近發布 Jiminny。 9 月,它向一些開發人員提供了 Jiminny 的較小版本進行測試。
但在同乙個月,OpenAI 率先推出 GPT-4,在多模態能力方面具有遠見卓識,這讓其技術和新業務受到更多關注。 據一位接近團隊的人士透露,Bard的使用者使用情況讓內部的一些高管感到失望。 谷歌在10月份披露,其雲計算部門在第三季度的收入僅增長了22%,而Microsoft在同一天宣布其Azure雲部門的收入增長了29%。 這只會增加 Jiminy 團隊提出大規模創新的壓力。
然後,在11月左右,在對新產品的執行審查中,最先進的Mimini模型在英語以外的語言中效果不佳。
OpenAI正面臨自己的問題,這是乙個小小的安慰。 2023 年年中,OpenAI 放棄了乙個名為 Arrakis 的重要新模型,因為它的訓練很差。 11月底,OpenAI董事會解雇了首席執行官山姆·阿爾特曼(Sam Altman),幾乎讓公司陷入癱瘓。 阿爾特曼在這次事件後回到了OpenAI,到目前為止似乎已經穩定了局勢。
終於,在12月初,谷歌揭開了Jimini的面紗。 它公布的測試結果顯示,Jiminnie 的最強版本 Jimini Super Edition 在許多行業標準基準測試中優於 GPT-4,儘管許多研究人員質疑這些說法。 這次備受矚目的發布會上最大的汙點是谷歌**的營銷,根據谷歌自己的說法,它誇大了 Jimini 的能力。 這個**的發布讓公司的一些普通員工感到沮喪,因為他們事先沒有看到它。 但一系列的宣告發出了乙個強烈的資訊:谷歌已經準備好競爭。
一位高管甚至抨擊Microsoft,指責它依賴OpenAI開發尖端技術。 谷歌和Alphabet全球事務總裁肯特·沃克(Kent Walker)在新聞機構Semafor主辦的一次活動中表示,該公司“不相信外包”其人工智慧開發。
現在,谷歌的測試是將 Jiminny 引入其產品組合的各個部分,就像Microsoft利用 OpenAI 的技術一樣。 但它有乙個競爭對手所沒有的優勢:一系列Pixel硬體裝置,包括手機、手錶和耳機,都可以從人工智慧中受益。 Jimini 的乙個版本是專門為 Pixel 手機設計的,該手機使用谷歌的定製人工智慧晶元。
Pixie 是專為 Pixel 裝置開發的 AI 助手,在科技公司競相將硬體與新的 AI 功能整合之際,它可以促進谷歌的硬體業務。 知情人士稱,Pixie將使用來自客戶手機的資訊,包括來自谷歌產品的資料,如地圖和Gmail,以發展成為更加個性化的Google Assistant版本。 此功能可能會在明年與 Pixel 9 和 9 Pro 一起推出。
最終,谷歌希望將這些功能引入其低端手機和手錶等裝置。 公司需要更複雜的模型來支援所有產品創意。 但它似乎正在努力確保它不會再次措手不及。 據一位知情人士透露,谷歌已經在訓練它的下乙個大模型,Jiminny 2。
Amir Efrati也為本文做出了貢獻。