開始大模特之戰！谷歌推出最強大的開源模型 Gemma

繼 2 月 16 日發布 Gemini 1 之後5. OpenAI 的 GPT-4 之後的正面很硬。當地時間2月21日，谷歌推出新一代開源模型“Gemma”，直接指代Meta的開源模型Llama 2。

谷歌表示，GEMMA是“最先進”的輕量級開放模型系列，超過了Mistral 7B和Llama 2，成為迄今為止同類語言模型中最強大的語言模型。

據谷歌官網稱，GEMMA在拉丁語中意為“寶石”，以它命名的開放模型系列GEMMA是由谷歌DeepMind等團隊開發的，使用與建立雙子座模型相同的研究和技術。

目前，GEMMA系列有“GEMMA 2B”和“GEMMA 7B”兩種尺度可供選擇，即20億個引數和70億個引數，以滿足開發者的不同需求。

在效能方面，它在多項測試中都領先於 LLAMA 2，包括 MMLU、BBH、MATH 等。

其中，GEMMA 7B在MMLU（Massive Multitasking Language Understanding）中獲得了64分。3%。就其大小而言，最初最強的Mistral 7b得分為625%，Meta 的 Llama-2 7b 和 13b 為 452% 和 548%，這與傑瑪相去甚遠。

在使用方面，開發人員可以根據自己的資料對 GEMMA 模型進行微調，並在框架、工具和硬體之間對其進行優化。首先，谷歌通過了原生的keras 30 相容所有主要框架（Jax、Pytorch 和 TensorFlow），並為 GEMMA 提供了用於推理和監督微調（SFT）的工具鏈。

同時，GEMMA 支援多個 AI 硬體平台，包括 NVIDIA GPU 和 Google Cloud TPU，這使得 GEMMA 模型可以在所有型別的裝置上執行，包括膝上型電腦、台式機、物聯網、移動裝置和雲。

然而，與閉源模型相比，開源模型的安全性也是很多人關心的問題。

為此，Google 使用自動化技術從訓練集中過濾掉某些個人資訊和其他敏感資料。此外，人類反饋（RLHF）被用於廣泛的微調和強化學習，以使指令調整模型與負責任的行為保持一致。還評估了GEMMA模型的風險狀況。

GEMMA 的推出恰逢 Google 新推出的 Responsible Generative AI Toolkit，以幫助開發人員和研究人員優先構建安全和負責任的 AI 應用程式。

谷歌表示，作為乙個開放的產品，GEMMA允許所有組織，無論規模大小，都以商業上負責任的方式使用它，並符合安全標準。

此外，谷歌副總裁兼總經理兼開發者關係主管珍妮·班克斯（Jeanine Banks）也強調，GEMMA與Meta的開源不同，Meta的開源有許可條款，阻止其大型科技競爭對手使用其LLAMA 2開源模式，而谷歌GEMMA則沒有這樣的商業限制。這波谷歌確實在得分！

事實上，在人工智慧領域，如果說Meta是大模型開源的鼻祖，那麼谷歌可以說是人工智慧領域的開源鼻祖。無論是 OpenAI 還是 Meta，谷歌的競爭對手，還是任何生成式 AI 公司，他們都離不開 Transformer 框架的影響。

Transformer 框架在 Google 2017 年的“Attention is All You Need”** 中首次被提及。作者：Vaswani，谷歌的人工智慧研究員，等人。

在 Google 發布之前，OpenAI 的技術路線圖主要集中在卷積神經網路（CNN）和遞迴神經網路（RNN）上。由於 Transformer 架構的提出，有助於解決 RNN 在長距離依賴問題中的困境。

原件中變形金剛模型主要部件的插圖。

Transformer 模型在機器翻譯、文字摘要、問答等任務中取得了顯著的成績，並迅速成為自然語言處理領域的標準模型。當今的大多數大型語言模型，包括 GPT-2、GPT-3、GPT-4、Claude、BERT、XLNet、Roberta 和 ChatGPT，都展示了 Transformer 執行各種自然語言處理（NLP）相關任務的能力。

另一方面，谷歌在人工智慧領域的實力此前一直被低估，可以說甚至比OpenAI、Meta等競爭對手擁有更大的先發優勢。

但自 2022 年 ChatGPT 發布以來，OpenAI 代表了世界上最先進的生成式大模型。谷歌作為先驅，在這個領域幾乎“消失”了。

為了應對ChatGPT的挑戰，谷歌於2023年3月緊急推出了Bard。 2023年12月，Gemini多模態大模型發布。與此同時，谷歌也面臨諸多質疑，甚至被指責在發布會上呈現假片段。

面對外部打擊，谷歌並沒有就此止步。 2024 年 2 月，谷歌將發布 Gemini Ultra 免費版和 Gimini 15. GEMMA開源三大舉措。可以看出，谷歌一直在用實際行動證明自己。

近日，OpenAI再次推出顛覆性產品Sora，將多模態人工智慧領域提上日程。這對谷歌來說壓力很大，但並不可怕。

早在去年年底，谷歌就推出了第一代模型視訊詩人。據谷歌稱，該模型可以“零鏡頭生成”，不僅支援常見的文生和土生，還支援編輯、風格化、擴充套件和配樂。從谷歌提供的輸出**效果來看，VideoPoet與之前的AI**大模型相比，確實有了質的飛躍。未來，它可能會與OpenAI競爭。

目前，在開源大模型領域，隨著谷歌的強勢進軍，已經形成了三足的局面：Meta、歐洲Mistral AI和谷歌。在閉源大模型領域，谷歌在OpenAI和Microsoft領導的陣營中佔據了一席之地。

再過不到兩個月的2024年，“大模型之戰”就已經開始，可以預見，2024年大模型領域的競爭將進一步公升溫。

但就國內市場而言，沒有誰能獨自掌控，我們還需要拭目以待，看看是否會有一匹黑馬如雨後春筍般湧現。當然，我們也期待這樣一匹黑馬的出現。

開始大模特之戰！谷歌推出最強大的開源模型 Gemma

相關問題答案

Google 推出 Gemini，最強大的大型語言模型

谷歌擴大了推出 AI 模型 Gemini 以挑戰 GPT 4 的舉動

谷歌大型AI模型雙子座出道擅長複雜主題推理，懂程式語言PKGPT 4

谷歌雙子座來了，國產大模還得內捲才長大？

谷歌推出 Gemma，乙個輕量級的開放 AI 模型

開始大模特之戰！ 谷歌推出最強大的開源模型 Gemma

相關問題答案

Google 推出 Gemini，最強大的大型語言模型

谷歌擴大了推出 AI 模型 Gemini 以挑戰 GPT 4 的舉動

谷歌大型AI模型雙子座出道 擅長複雜主題推理，懂程式語言PKGPT 4

谷歌雙子座來了，國產大模還得內捲才長大？

谷歌推出 Gemma，乙個輕量級的開放 AI 模型

開始大模特之戰！谷歌推出最強大的開源模型 Gemma

谷歌大型AI模型雙子座出道擅長複雜主題推理，懂程式語言PKGPT 4