谷歌發布了多模態大模型 Gemini,效能超越了 GPT 4 TPU v5p,效能提公升了 2 8 倍

Mondo 科技 更新 2024-01-29

據谷歌稱,Gemini Pro 與 OpenAI 一年前發布的 GPT-3 相同5 人工智慧模型與聲稱在八個基準測試中的六個中獲勝的產品競爭。 而更緊湊的奈米版本(18億和325 億個引數)專門針對 Android 應用開發進行了優化,它們是從更大的 Gemini 模型中提煉出來的。

Gemini 聲稱是目前最強大、最通用的型號,擁有 Gemini 1 的第乙個版本0 可以理解和操作不同型別的資訊,包括文字、影象、音訊和**。

Gemini 原生設計為多模態模型,一開始就對不同模態進行預訓練,然後使用額外的多模態資料進行微調以提高效能。 目前,雙子座 10 被訓練可以同時識別和理解文字、影象、音訊、**等不同型別的資訊,並能回答涉及複雜主題的問題,這也使雙子座擅長解釋和推理數學、物理等複雜問題。

這還不是全部,雙子座 10 能夠理解和解釋 Python、J**A、C++ 和 Go 等世界常用的程式語言,並產生高質量的程式。 值得一提的是,谷歌 DeepMind 在 2 年前推出了 AI** 生成系統 AlphaCode,現在通過 Gemini 的乙個特殊版本,建立了更高階的 AlphaCode 2,它不僅擅長程式設計,而且可以處理與數學和理論電腦科學相關的競爭性程式設計問題。

谷歌DeepMind團隊使用谷歌開發的TPU V4和V5E(張量處理單元)來加速機器學習習,大規模訓練Gemini 10。有三種型別的模型:Ultra、Pro 和 Nano,具體取決於模型的大小。

中端 Gemini Pro 能夠擊敗 GPT-35.可擴充套件以執行各種任務;Gemini Nano 用於特定任務和移動裝置。

Gemini Ultra 是專為高度複雜任務而設計的最大、最強大的型號,而 Gemini Nano 是處理裝置上任務的最有效型號。

雖然尚未正式公布,但據內部訊息人士透露,Gemini 擁有數萬億個引數,用於訓練的算力甚至是 GPT-4 的 5 倍。

由於它是用於強化 GPT-4 的模型,因此 Gemini 當然經過了最嚴格的測試。

谷歌評估了這兩種模型在各種任務上的表現,並驚喜地發現 Gemini Ultra 在 32 個常用的學術基準測試中的 30 個超過了 GPT-4,從自然影象、音訊、理解到數學推理

在MMLU(大規模多工語言理解)測試中,Gemini Ultra的得分為90分0分高,首次超越人類專家。

MMLU 考試包括數學、物理、歷史、法律、醫學和倫理學等 57 門科目,旨在考察世界的知識和解決問題的能力。

在這 50 多個不同的學科領域中,Gemini 與這些領域的最佳專家一樣出色。

谷歌對MMLU的新基準允許Gemini在回答複雜問題之前更仔細地使用推理,這比僅僅依靠直覺反應有了顯著的改進。

在同一天發表的一篇部落格文章中,谷歌表示,雙子座模型經過了嚴格的測試,並評估了它們在各種任務中的表現。

從自然影象、音訊和理解,到數學推理等任務,Gemini Ultra 在大型語言模型開發中廣泛使用的 32 個學術基準中的 30 個中,表現優於當前的 SOTA 結果。

此外,Gemini Ultra 在 MMLU(大規模多工語言理解資料集)中獲得了 90 分的高分。0%,首次超過人類專家。 MMLU資料集包含數學、物理、歷史、法律、醫學、倫理等57個學科,用於檢驗大模型的知識和解決問題的能力。

MMLU測試集的新方法使Gemini能夠在回答困難的問題之前利用其推理能力進行更仔細的思考,與僅根據第一印象回答問題相比,這比Gemini的表現有了顯著提高。

谷歌還特意公布了與目前Onpeai最強大語言模型GPT-4的對比,在各方面的能力上,結果顯示,在文字處理方面,除了90%的MMLU得分外,超過了GPT-4的86分除了 4% 之外,Gemini Ultra 在推理、數學、**和其他能力方面的得分高於 GPT-4。

在多模態方面,Gemini 在影象和音訊等各個方面的能力也都超過了 GPT-4。

谷歌首席科學家兼人工智慧負責人傑夫·迪恩(Jeff Dean)表示,雙子座模型在多模態模型推理能力方面達到了驚人的水平。

免責宣告: 1、本號碼不對所發布任何資訊的可用性、準確性、及時性、有效性或完整性作出任何宣告或保證,特此宣告不承擔任何責任或因資訊可能產生的任何後果。

2、本號碼內容為非商業性、非營利性,**內容不代表認同其觀點並對其真實性負責,亦無意構成任何其他指導。 對於所發布資訊或發布的任何資訊中的任何不準確或錯誤,我們概不負責。

3、本編號中的部分資訊、資料、文字等均在網際網絡上,並已註明。 如您發現有作品侵犯您的智財權和個人合法權益,請與我們聯絡,我們將及時修改或刪除。

相關問題答案

    谷歌發布了 Gemini,一款效能優於 GPT 4 的多模態大模型!

    近日,谷歌CEO桑達爾?Pichai 和 DeepMind 首席執行官 Damith Hassabis 在谷歌官網上的一篇文章中宣布,谷歌最新的多模態大型模型 gemini版本 正式上線。該模型被稱為 Gemini,不僅優於 OpenAIGPT 模型,而且還是最強大 用途最廣泛的模型之一。Gemin...

    谷歌發布了 Gemini,乙個效能比 GPT 4 更好的多模態大模型?

    Gemini 是 AI 領域的革命性突破,Google 發布了 Gemini 版本 有望在效能上超越 OpenAI 的 GPT 模型,成為目前功能最強大 用途最廣泛的模型。Gemini 的獨特之處在於它是乙個多模態模型,能夠同時理解和操作不同型別的資訊,例如文字 影象 音訊和 Gemini 使用原生...

    谷歌發布多模態AI大模型,可布局文化媒體三大細分領域

    谷歌最近發布了一款多模態AI模型Gemini,可以同時識別和理解文字 影象 音訊和五種型別的資訊。受此訊息影響,文化傳媒板塊日掀起漲潮,其中世紀天虹 山東出版 出版傳媒 龍傳媒等多條 漲停,全板塊漲 從兩市產業板塊資金流向來看,文化傳媒板塊重拾資金青睞,當日主要資金淨流入億元。盤面顯示,日中國 出版...

    多模態大模型陸續發布,AI應用落地迎來加速增長期

    金融投資報記者 林珂 人工智慧應用的進步持續加速。谷歌近日發布了多模態AI模型Gemini,可以同時識別和理解文字 影象 音訊和五種資訊,其中GeminiUltra版本是首款在MMLU任務中表現優於人類專家的大模型,或進一步拓展了多模態大模型的應用場景。開源分析師方光光認為,海外科技巨頭基於AI多模...

    深化AIGC大模型多模態應用,AI Agent加速應用普及

    報告製作人 招商局 跟蹤當前AIGC行業的發展,大模型的多模態發展進一步深化,尤其是文盛 能力的快速提公升,將大大降低創作門檻,開拓C端創作的商業空間,以及遊戲 影視製作等B端應用空間。在應用端,隨著大模型能力的提公升和大模型開發工具門檻的降低,AI智慧型體的構建能力有望快速下沉,這將推動AI應用的...