12 月 7 日,谷歌在發布會上宣布推出最大、最強大的人工智慧模型 Gemini,谷歌表示它仍然是世界上最偉大的公司之一,稱 Gemini 在一系列測試中的表現優於 OpenAI 的 GPT-4 模型,尤其是在多模態**、語音任務方面,Gemini 測試效能優於各個領域的專業人類!
昨日,谷歌CEO桑達爾·皮查伊(Sundar Pichai)和研發主管德公尺斯·哈薩比斯(Demis Hassabis)作為谷歌大模型團隊的代表,正式推出了大模型Gemini!
哈薩比斯這個名字很熟悉,是Deepmind的CEO,此前帶領團隊開發AlphaGo,擊敗了人類棋手李世石和柯傑,進一步將神經網路所代表的深度學習習推向了高潮!
一直以來,谷歌一直被視為全球技術創新的領導者,但自從Microsoft發布GPT模型,尤其是ChatGPT的誕生後,谷歌就被打了個猝不及防,DeepMind和Google Brain現在已經完成了整合。
去年ChatGPT發布不到兩周,谷歌就匆匆拿下了Bard,但演示中卻錯了,導致谷歌股價一夜之間蒸發了1000多億美元,隨後谷歌也向Anthropic注資,推出了Claude 2來對付ChatGPT。
在谷歌內部,Gemini 一直被期待超越 ChatGPT,谷歌“Deep Thinking”的 Eli Collins 表示,Gemini 是該公司規模最大、能力最強的模型,但它也是最通用的多模態模型。
Gemini 可以用來處理 **、音訊和文字等多種形式的資訊,正如你在演示中看到的那樣,當人類畫乙隻鴨子時,Gemini 會快速識別它,並且在新增波浪線後,Gemini 還可以實時理解鴨子在游泳。
Hassabis 推出 Gemini 10,分為三個不同引數的版本,分別是Gemini Nano、Pro和Ultra,其中最小的是Nano,讓人想起蘋果停產的iPod系列,這個版本是專門為移動裝置設計的,可以在智慧型手機上原生執行。
而 Pro 版本已經能夠擊敗 OpenAI 的 GPT35. Ultra 是當今最強大的多模態模型,對標 GPT-4,在各個方面都能碾壓現有的 AI 大模型,在 MMLU(大規模多工語言理解)中超過 90% 的人類專家,也是準確率最高的大模型!
Hassabis 強調,Gemini Ultra 優於 GPT-4 主要是因為 ** 和音訊的理解和互動能力,OpenAI 採用了 GPT+DALL·E+Whisper打造多模態,而Gemini從一開始就專注於多模態混合,預計Gemini Nano將在Pixel 8 Pro上線,Gemini Pro將於12月13日向企業使用者和開發者開放Gemini API介面。