當談到當前人工智慧熱潮背後的技術時,Alphabet Inc.的谷歌實際上是發明者,但其產品的受歡迎程度已經明顯滯後。 這家搜尋引擎巨頭希望通過發布備受期待的雙子座來改變這種狀況,這是該公司迄今為止建立的“最大、最強大的工人智慧型模型”。
自從 OpenAI 去年憑藉其對話式聊天機械人 ChatGPT 取得巨大成功以來,越來越多的公司一直在嘗試生成式 AI,這是一種可以自動執行編碼、總結報告或根據使用者要求建立營銷活動等任務的技術。 在 12 月 6 日發布前的演示中,谷歌強調 Gemini 是它構建的最靈活的型號,因為它有不同尺寸的版本,包括直接在智慧型手機上執行的版本。 這使它有別於其他競爭對手。
該 AI 模型是乙個旨在支援各種生成式 AI 應用程式的系統,它有三個不同的版本:Gemini Ultra、Gemini Pro 和 Gemini Nano。 谷歌DeepMind部門產品副總裁Eli Collins表示,這種多樣性意味著Gemini“能夠在從移動裝置到大型資料中心的所有裝置上執行”。
長期以來,我們一直希望構建新一代的人工智慧模型,其靈感來自人們理解世界和與世界互動的方式——一種感覺更像是乙個有用的合作者,而不是乙個智慧型軟體,“柯林斯在接受記者採訪時說。 ”
在該模型發布之前,該公司對 Gemini 進行了一系列標準的行業基準測試,並表示八項測試中有六項表明 Gemini Pro 的效能優於 OpenAI 的 GPT-35。谷歌聲稱,在通用語言理解、推理、數學和編碼方面進行的八項基準測試中,有七項優於 OpenAI 通用模型的最新版本 GPT-4。 與此同時,谷歌估計,該公司最新的可解釋和生成**生成式人工智慧產品alphacode 2在競爭激烈的程式設計領域表現優於85%的競爭對手。 該公司將發布乙份技術報告,更深入地解釋 Gemini 的模型架構、訓練過程和評估。
從 12 月 6 日開始,想要為智慧型手機和平板電腦編寫 Gemini 驅動的應用程式的 Android 開發人員將能夠註冊使用直接在此類裝置上執行的 AI 模型的“奈米”版本。 谷歌還表示,將立即在其旗艦手機 Pixel 8 Pro 上啟用 Gemini,並將支援新的生成式 AI 功能,例如從**錄音中總結點。 下週,谷歌將通過其Vertex AI和AI Studio平台向雲客戶提供Gemini Pro。
Gemini Ultra 是谷歌 AI 模型的最大版本,最初將在面向開發人員和企業公司的搶先體驗計畫中提供,有關該計畫的詳細資訊將於下週公布。 該版本將於明年初向公眾廣泛提供。
Gemini 還可以通過 Bard 與谷歌的大量應用程式和服務整合,Bard 是該公司的對話式聊天機械人,是 ChatGPT 的競爭對手。 此前,Bard 使用了谷歌的 Palm 2 模型,這是該公司在 5 月份的年度開發者大會上宣布的大型語言模型。
在過去的一年裡,谷歌一直面臨著重塑其核心搜尋業務和應對一波生成式人工智慧程式的壓力。 雖然該公司長期以來一直被視為人工智慧研究的先驅,但一些人批評其管理層在營銷人工智慧產品時反應遲鈍,尤其是在 ChatGPT 和影象生成器 Dall-E 等產品取得成功之後。 自 OpenAI 於 3 月發布 GPT-4 以來,谷歌一直在努力重新確立其在該領域的領導地位,包括將這項新技術注入其已建立的搜尋業務。
Gemini 是該公司應對這一市場壓力的答案。 谷歌表示,人工智慧模型是“自然多模態的”,這意味著它從一開始就經過了預訓練,可以處理來自使用者的基於文字和影象的提示。 例如,在乙個演示中,谷歌展示了父母如何通過上傳數學問題的影象並在草稿紙上嘗試解決該問題的步驟來幫助孩子完成家庭作業。
在演示**中,谷歌軟體工程師泰勒·阿普爾鮑姆(Taylor Applebaum)表示,“Gemini 不僅可以解決這些問題,還可以閱讀答案,了解什麼是對的,什麼是錯的,並解釋需要進一步澄清的概念。 該公司還表示,其“搜尋生成體驗”——使用其生成式人工智慧技術構建的谷歌搜尋引擎的實驗版本——將在明年整合Gemini的新功能。
儘管如此,該公司的代表警告說,Gemini仍然容易產生“幻覺”,即生成式AI產生的虛假或捏造資訊。 柯林斯稱這種現象為“乙個未解決的研究問題”。 該公司向記者展示的演示文稿**是預先錄製的。
柯林斯表示,Gemini“擁有谷歌所有人工智慧模型中最全面的安全評估。 他說,為了評估Gemini的安全性,谷歌對AI模型進行了對抗性測試,模仿了乙個試圖利用該程式的壞人。 該測試包括“真正的毒性提示”,這是一項由艾倫人工智慧研究所開發的測試,其中包含從網路中提取的100,000多個提示,以幫助人工智慧研究人員檢查大型語言模型中的仇恨言論和政治偏見。
谷歌還強調,這個工具的速度會很快。 該公司表示,Gemini 使用新的底層超級計算機架構和更新的處理晶元,使其執行速度比早期的小型型號更快。 谷歌正在使用其雲晶元的新版本,即云張量處理單元(TPUS),這是一種內部設計的晶元,訓練現有模型的速度比其前身快2.28次。 谷歌機器科學習副總裁阿明·瓦赫達特(Amin Vahdat)表示,這種方法為谷歌提供了“對未來標準人工智慧基礎設施的新視角”。 他補充說,該公司仍將使用第三方AI晶元來執行其Gemini模型。
Gemini 將整合到谷歌 3 月推出的生成式 AI 聊天機械人 Bard 中,使其能夠利用該公司最受歡迎的服務,包括 Gmail、地圖、Docs 和 YouTube。 推出將分兩個不同的階段進行:從 12 月 6 日開始,Bard 將由 Gemini Pro 提供支援,這將支援高階推理、計畫、理解和其他功能。 它將能夠在 170 個國家和地區以英語運營,但值得注意的是,歐洲或英國不包括在內,該公司表示正在與當地監管機構進行談判。
明年年初,該公司打算發布Bard Advanced,它將由更強大的Gemini Ultra型號提供動力。 谷歌表示,它將很快推出乙個值得信賴的測試器,以改進Bard Advanced,然後再向公眾廣泛使用。
谷歌Bard產品副總裁Sissie Hsiao表示:“通過Gemini,Bard正在進行迄今為止最大和最好的公升級,為人們創造、互動和協作開闢了新的方式。 ”
本文來源:金融界。