據谷歌稱,Gemini Pro 與 OpenAI 一年前發布的 GPT-3 相同5 人工智慧模型與聲稱在八個基準測試中的六個中獲勝的產品競爭。 而更緊湊的奈米版本(18億和325 億個引數)專門針對 Android 應用開發進行了優化,它們是從更大的 Gemini 模型中提煉出來的。
Gemini 聲稱是目前最強大、最通用的型號,擁有 Gemini 1 的第乙個版本0 可以理解和操作不同型別的資訊,包括文字、影象、音訊和**。
Gemini 原生設計為多模態模型,一開始就對不同模態進行預訓練,然後使用額外的多模態資料進行微調以提高效能。 目前,雙子座 10 被訓練可以同時識別和理解文字、影象、音訊、**等不同型別的資訊,並能回答涉及複雜主題的問題,這也使雙子座擅長解釋和推理數學、物理等複雜問題。
這還不是全部,雙子座 10 能夠理解和解釋 Python、J**A、C++ 和 Go 等世界常用的程式語言,並產生高質量的程式。 值得一提的是,谷歌 DeepMind 在 2 年前推出了 AI** 生成系統 AlphaCode,現在通過 Gemini 的乙個特殊版本,建立了更高階的 AlphaCode 2,它不僅擅長程式設計,而且可以處理與數學和理論電腦科學相關的競爭性程式設計問題。
谷歌DeepMind團隊使用谷歌開發的TPU V4和V5E(張量處理單元)來加速機器學習習,大規模訓練Gemini 10。有三種型別的模型:Ultra、Pro 和 Nano,具體取決於模型的大小。
中端 Gemini Pro 能夠擊敗 GPT-35.可擴充套件以執行各種任務;Gemini Nano 用於特定任務和移動裝置。
Gemini Ultra 是專為高度複雜任務而設計的最大、最強大的型號,而 Gemini Nano 是處理裝置上任務的最有效型號。
雖然尚未正式公布,但據內部訊息人士透露,Gemini 擁有數萬億個引數,用於訓練的算力甚至是 GPT-4 的 5 倍。
由於它是用於強化 GPT-4 的模型,因此 Gemini 當然經過了最嚴格的測試。
谷歌評估了這兩種模型在各種任務上的表現,並驚喜地發現 Gemini Ultra 在 32 個常用的學術基準測試中的 30 個超過了 GPT-4,從自然影象、音訊、理解到數學推理
在MMLU(大規模多工語言理解)測試中,Gemini Ultra的得分為90分0分高,首次超越人類專家。
MMLU 考試包括數學、物理、歷史、法律、醫學和倫理學等 57 門科目,旨在考察世界的知識和解決問題的能力。
在這 50 多個不同的學科領域中,Gemini 與這些領域的最佳專家一樣出色。
谷歌對MMLU的新基準允許Gemini在回答複雜問題之前更仔細地使用推理,這比僅僅依靠直覺反應有了顯著的改進。
在同一天發表的一篇部落格文章中,谷歌表示,雙子座模型經過了嚴格的測試,並評估了它們在各種任務中的表現。
從自然影象、音訊和理解,到數學推理等任務,Gemini Ultra 在大型語言模型開發中廣泛使用的 32 個學術基準中的 30 個中,表現優於當前的 SOTA 結果。
此外,Gemini Ultra 在 MMLU(大規模多工語言理解資料集)中獲得了 90 分的高分。0%,首次超過人類專家。 MMLU資料集包含數學、物理、歷史、法律、醫學、倫理等57個學科,用於檢驗大模型的知識和解決問題的能力。
MMLU測試集的新方法使Gemini能夠在回答困難的問題之前利用其推理能力進行更仔細的思考,與僅根據第一印象回答問題相比,這比Gemini的表現有了顯著提高。
谷歌還特意公布了與目前Onpeai最強大語言模型GPT-4的對比,在各方面的能力上,結果顯示,在文字處理方面,除了90%的MMLU得分外,超過了GPT-4的86分除了 4% 之外,Gemini Ultra 在推理、數學、**和其他能力方面的得分高於 GPT-4。
在多模態方面,Gemini 在影象和音訊等各個方面的能力也都超過了 GPT-4。
谷歌首席科學家兼人工智慧負責人傑夫·迪恩(Jeff Dean)表示,雙子座模型在多模態模型推理能力方面達到了驚人的水平。
免責宣告: 1、本號碼不對所發布任何資訊的可用性、準確性、及時性、有效性或完整性作出任何宣告或保證,特此宣告不承擔任何責任或因資訊可能產生的任何後果。
2、本號碼內容為非商業性、非營利性,**內容不代表認同其觀點並對其真實性負責,亦無意構成任何其他指導。 對於所發布資訊或發布的任何資訊中的任何不準確或錯誤,我們概不負責。
3、本編號中的部分資訊、資料、文字等均在網際網絡上,並已註明。 如您發現有作品侵犯您的智財權和個人合法權益,請與我們聯絡,我們將及時修改或刪除。