超越 GPT 4!谷歌發布最強大的多模態大型模型 Gemini

Mondo 科技 更新 2024-01-28

12月7日凌晨,谷歌在其官網上發布了一款全新且功能最強大的多模態大模型——雙子座。

據悉,Gemini 有 Ultra、Pro、Nano 三個版本,可以自動生成文字、總結內容等,並理解**、音訊和**內容。 在 MMLU、Drop、Hellaswag、GSM8K 等主流評測中,Gemini Ultra 的能力全面超越 OpenAI 的 GPT-4 和 GPT-4 V。

值得一提的是,Gemini Ultra在MMLU中拿下了90%的分數,這也是MMLU上首款超越人類專家的大型車型。

目前,谷歌已經宣布了 Gemini**,它將從 12 月 13 日起為 Gemini Pro 提供 API。 Ultra版本仍在安全和功能優化過程中,即將上市。

使用者可以在谷歌的類ChatGPT產品Bard中體驗Gemini Pro版模型,該產品支援中文。

巴德位址:

* 位址: Gemini Pro API 位址:

雙子座簡介。

Gemini 有三個版本,Ultra 是最強大的版本,可以用於超複雜的推理和理解,但 AI 算力消耗也非常大

Pro 的引數只有 Ultra 的一半,但對於大規模應用部署來說,效能非常好Nano 是一種輕量級模型,適用於移動裝置和個人小規模部署。

雙子座介紹道。

在技術架構上,Gemini 模型的基礎設施建立在 Transformer 編碼器結構之上,採用多層自注意力和前饋神經網路對序列依賴關係進行建模。 不同的是,Gemini 採用了多查詢注意力機制,這也是處理複雜長文字的關鍵。

傳統的 transformer 結構採用單查詢注意力機制,即查詢鍵值對的拼接對於每個位置都是唯一的。 但對於非常長的序列,這在計算上會很昂貴。

Gemini 使用多查詢注意力機制,其基本思想是使用一組查詢向量,而不是序列中每個位置的唯一查詢向量。

具體來說,該模型首先將輸入序列的每個位置編碼為一組查詢向量。 然後,將這些查詢向量與鍵值對並行處理,得到多個注意力結果。

此外,Gemini 模型還使用類似詞片的 SentencePiece 演算法在詞級對輸入序列進行分割,可以支援多種語言,節省計算資源。

在訓練資料方面,Gemini 使用來自線上文字、書籍和**的大量資料進行預訓練。 在對資料進行取樣之前,開發者進行了嚴格的資料篩選,以去除暴力、虛假、歧視等有害內容。

雙子座的各種能力。

理解文字、音訊。

Gemini 模型在海量資料上進行訓練,以識別和理解文字、影象、音訊和其他內容,並回答與複雜主題相關的問題。 因此,非常擅長解釋數學和物理等複雜學科的推理任務。

生成**。 Gemini 可以生成和理解 Python、J**A、C++ 和 Go 等主流語言。 Gemini Ultra 在多個編碼基準測試中表現出色,包括 Humaneval,這是評估編碼任務效能的重要行業標準。

谷歌還基於Gemini模型開發了專業的**模型AlphaCode 2。 與上一代產品相比,AlphaCode 2 的效能至少提高了 50%。

複雜的推理。 Gemini 的多模態功能使其在視覺理解、文字生成等方面非常強大。 例如,從數十萬字中整理要點;

從 200 頁的財務報告中找出最有價值的內容。 這對金融、科技、醫療等領域的科研和業務人員有很大幫助。

對吟遊詩人的支援

目前,谷歌的 Bard 已經整合了 Gemini Pro 模型,AIGC 開放社群也體驗過,其理解和文字生成能力比以前強了很多,尤其是生成和評論能力非常出色。

雙子座全面超越GPT-4

谷歌在 MMLU、Drop、Hellaswag、GSM8K 等主流評測中對 Gemini 和 OpenAI 的 GPT-4 和 GPT-4 V 進行了深入評估。

測試資料顯示,Gemini Ultra 在大型語言模型研發中廣泛使用的 32 個學術基準中,有 30 個優於 30 個,是第乙個在 MMLU 上表現優於人類專家的大型模型。

此外,Gemini Nano 模型在移動裝置上展示了出色的自然語言處理能力。 特別是,在對目標任務進行微調後,它在閱讀理解和摘要生成等任務中優於其他同規模的模型。

谷歌首席執行官桑達爾·皮查伊(Sundar Pichai)表示,Gemini是我們迄今為止功能最強大、用途最廣泛的型號,在許多領先的基準測試中表現異常出色。

Gemini 的第乙個版本針對不同的尺寸進行了優化,適用於不同的人群和行業。 Ultra、Pro 和 Nano 是 Gemini 的首批型號,也是我們創立 Google Deepmind 願景的首次實現。 我們很高興在未來繼續發布更強大的模型。

本文素材**Google官網,雙子座**,如有侵權,請聯絡刪除。

end

相關問題答案

    這就是為什麼人們說 GPT 4 變得“懶惰”的原因。

    近幾個月來,OpenAI 的 GPT 語言模型在 AI 行業引起了不小的轟動。這個熱門話題在科技界引發了一場關於人工智慧技術與倫理發展的大討論。在首席執行官山姆 奧特曼 Sam Altman 迅速解雇和重新聘用後,ChatGPT Plus付費訂閱服務的突然停止更加令人費解。這些事件引發了更多關於 O...

    112 頁的報告深入挖掘 GPT 4V!加州大學洛杉磯分校(UCLA)等人發布了MathVista,乙個多模態數學推理基準

    編輯 LRS 近日,加州大學洛杉磯分校 UCLA 等機構發布了乙個名為Mathvista的新的多模態數學推理基準資料集,並提供了乙份長達頁的詳細評估報告,重點關注大型多模態模型的數學推理效能。位址 專案位址 資料集 資料視覺化 數學推理能力被視為實現通用人工智慧的關鍵一步。除了傳統的純文字場景外,許...

    比 ChatGPT 4 更好!谷歌最強大的AI模型Gemini 1 0發布

    在今年 月的開發者大會上,谷歌首次向公眾透露,他們正在開發他們正在開發的大型 AI 模型 Gemini。經過七個月的精心開發,備受期待的AI模型終於面世。近日,谷歌正式發布了Gemini ,被譽為 最強大 最通用 最靈活的模型 將為AI領域帶來新的挑戰。Gemini 是 Google Brain 團...

    市值超過特斯拉!位元幣重回4萬美元,幣圈的春天來了嗎?

    本報 中國時報 net.CN 記者趙毅 胡金華上海報道。在穩定幣 Terrausd 崩潰之前,位元幣的最後 是 , 美元,從那時起加密市場一直處於黑暗狀態。月日,沉寂了天的位元幣突然爆雷,觸及, 美元大關是當天的最大漲幅,接近 繼續創下 年 月以來的新高。截至發稿時,CoinMarketCap資料顯...

    跟隨董傑學穿衣,4個搭配創意超越“精緻土”,展現高階休閒美

    展現高階放鬆之美 與董傑一起學穿搭,個搭配思路超越 精緻土 在時尚圈,有乙個詞迅速走紅,那就是 精緻大地 雖然這個詞很流行,但它並不意味著任何積極的東西,因為 地球 本身並沒有時尚的奢華感。那麼,如何讓自己遠離 嬌嫩的土壤 呢?不妨跟著著名女演員董潔一起學習穿衣打扮。在這篇文章中,我將與大家分享個與...