在沉寂了一年之後,谷歌帶著旗下的多模態大模型雙子座(Gemini)重返AI圈。
此前,谷歌曾憑藉AlphaGo在全球掀起一股AI浪潮。 但新一波AI的風頭已經被ChatGPT搶走了,谷歌急需一款現象級的AI產品來證明自己的實力,這也就不難理解為什麼谷歌要冒著風險在演示中誇大自己大模型的效能了**。 因為他們希望雙子座看起來比競爭對手更好。
從名字也可以看出,谷歌對雙子座超越人腦的能力寄予厚望。 官方認為,Gemini 是 AI 模型的巨大飛躍,其許多功能都超過了 ChatGPT。 從那以後,谷歌正式向競爭對手OpenAI和Microsoft宣戰,爭奪AI霸主地位。 AI圈最強的終於不再是ChatGPT的獨角戲了。
爭奪最強大模型的戰鬥正在冒煙。
作為 ChatGPT-4 的殺手級功能,谷歌稱 Gemini 是迄今為止最大、功能最強大、最靈活的 AI 模型。 不僅如此,谷歌還表示,Gemini 是乙個從頭開始構建的多模態模型,更接近人類理解世界的方式。
與ChatGPT的逐步更新不同,谷歌一次性發布了Gemini的三種模式,分別是Gemini Nano、Gemini Pro和Gemini Ultra。 不同版本在效能上有明顯的差異,現在每個人都可以使用Gemini Pro,但從功能上講,可以與ChatGPT競爭的是Gemini Ultra。
雖然**的推廣被推翻了,但Gemini的資料表現還是相當不錯的。 在計算效能方面,Gemini 幾乎“擊敗”了 GPT-4。 Gemini Ultra 在 32 個多模式基準測試中的 30 個中表現優於當前的 SOTA 結果。 在數學題、Python**任務、閱讀等方面,Gemini 的表現超過了以前的最高水平。
Gemini 是第乙個在純文字問題的 MMLU(大規模多工語言理解)評估中優於人類專家的模型。 Gemini 在此類問題上得分為 90%,人類專家得分約為 89%,GPT-4 得分為 86%; Gemini 在多模態問題上的得分為 59%,GPT-4 得分為 57%,表現最好。
除了在常規能力上超越GPT-4外,Gemini最大的特點是多模態,即可以同時識別和理解文字、影象、音訊、**和**五種資訊,使用者可以交錯新增文字、影象、**等內容,Gemini還可以輸出相應的交錯文字和影象。 從一開始,Gemini 就對不同的模態進行了預訓練,並使用額外的多模態資料進行了微調,這進一步提高了模型的有效性。
衝刺能否將優勢保持到最後? 答案可能不一定。
對於初出茅廬的大型模型行業來說,行業格局尚未確定,後續的競爭依然充滿變數。 谷歌一開始在AI領域遙遙領先,但最終卻趕上了OpenAI; ChatGPT一出現就震驚了,現在已經被雙子座超越了......這樣的故事不斷發生。 谷歌展示的多模式能力實際上可以在一年內實現。 但ChatGPT還會在一年內繼續迭代,屆時雙子座還會是ChatGPT的對手嗎?
谷歌的野心不僅限於追趕,而是想在各個方向上碾壓它。 Gemini 的發布不僅是為了與 ChatGPT 競爭,也是為了潛伏在乙個更大的專案背後。 除了 Gemini,Google 還發布了迄今為止功能最強大、最高效、可擴充套件性最強的 TPU 系統 Cloud TPU V5P,專為訓練尖端 AI 模型而設計。 下一代 TPU 將加速 Gemini 的開發,幫助開發人員和企業客戶更快地訓練大規模生成式 AI 模型,並開發新產品和新功能。 更可靠、更可擴充套件的訓練模型和最高效的服務模型是谷歌打造雙子座的重要目標。
在這場戰鬥中,谷歌的布局影響深遠,其奪回AI霸權的野心顯而易見。 面對已經打出王彈的谷歌,對手OpenAI絕對不會坐以待斃,而OpenAI的訣竅就是猜不出它會打出什麼牌。 在爭奪最強大模型的戰鬥中,槍枝已經開始。
大模的競爭才剛剛開始,國內同行不得不更加努力。
過去一年,國內比較知名的大模型有科大訊飛星火、騰訊混元、商湯諮詢、文心億言、位元組跳動豆寶、知步AI-chatGLM、阿里通益千文等。
從表面上看,每個大模型都有自己的優勢,但實際上還處於起步階段,演算法尚未取得突破性成果,與國外大模型相比,還存在一定的差距,Gemini的出現可能會加速行業優勝劣汰,讓一大批競爭力不足的產品加速出局, 同時,也啟發了國內大模式:與其後續研發,不如盡快在現有產品和服務中賦能AI功能,成本更低,見效更快。
在大模型的競爭中,頭部玩家的經驗或多或少會被其他追趕者重用,這對後來者來說是乙個寶貴的習學習機會,只要保持追趕的勢頭,就有超越的可能,這次是谷歌,下一次會是誰?