Microsoft 推出了 Phi 2,這是一種能夠超越 Llama 2 和 Gemini 的人工智慧

Mondo 科技 更新 2024-01-29

Microsoft 宣布了 PHI-2,這是一種小型語言模型 (SLM),其效能優於 Meta 的 LLAMA 2、谷歌的 Gemini 和其他競爭對手。 該模型由Microsoft Research開發,具有出色的推理和語言理解能力。

研究人員進行了幾次測試並發現了它在某些任務上優於 Meta AI 和 Google AI

PHI-2 是基於 transformer 的模型系列的一部分,引數數量較少。 根據 Microsoft 的說法,其開發背後的想法是基於它可用的前提更廣泛模型(如 LLAMA 或 MISTRAL)的近似效能

為了讓您了解它的大小,PHY-2 有 27 億個引數,而 GPT-4 大約有 1 個引數7 萬億個引數。

儘管存在此限制,但 Microsoft 的 AI仍然匹配或優於大 25 倍的模型。在一系列數學和程式設計測試中,PHI-2 的表現優於 META 的 LLAMA 2。 創作者更進一步,將其與Gemini Nano 2進行了比較,後者以類似於谷歌人工智慧的方式成功解決了物理問題。

PHI-2 只有 27 億個引數,在多個基準測試中的引數 7b 和 13b 優於 Mistral 和 Llama-2 模型。 特別是,與 25-2-70b 模型相比,它在多步推理任務(即編碼和數學)中實現了更好的效能,後者高出 70 倍。

他們提到了程式設計師。

秘訣在於訓練......Phi-2 使用資料集進行訓練,其中包括合成的 NLP 文字、從 Stack Overflow 獲得的子集、程式設計競賽等。

Microsoft提到,訓練資料的質量在模型效能中起著關鍵作用。 與 GPT-4 不同,Microsoft 將根據其教育價值篩選 Web 資料。

我們的訓練資料集包含專門建立的合成資料集,用於教授您的模型一般推理和一般知識,包括科學、日常活動、心理理論等。

PHI-2 訓練歷時 14 天,使用了 96 塊 NVIDIA A100 顯示卡。 雖然沒有進一步的改進,但與LLAMA 2相比,SLM的反應毒性和偏差較小。 Microsoft Research表示已根據學術參考資料進行了廣泛測試不幸的是,PHI-2 僅適用於研究專案。 SLM 將作為 Azure AI Studio 的一部分提供,以鼓勵語言模型的開發。 目前的許可證不允許將其用於 ChatGPT 等商業應用程式。

相關問題答案

    Microsoft推出了小型型號 Phi 2,其效能優於 Llama 2 Mistral 7B

    Microsoft 宣布推出 億引數的語言模型 phi ,並聲稱其效能可以與大 倍的模型相媲美或更好。表現出出色的推理和語言理解能力,在少於 億個引數的基礎語言模型中展示了最先進的效能。其基準測試結果顯示,在各種綜合基準測試中,PHI 僅具有 億個引數,在 b 和 b 引數下優於 Mistral 和...

    Microsoft Surface Pro 9怎麼樣,這是一款結合了效能和便攜性的二合一平板電腦

    Microsoft 的 Surface Pro 系列一直是二合一平板電腦的標桿,在效能 便攜性 易用性等方面表現出色。今年,Microsoft發布了全新的Surface Pro ,它在各個方面都得到了進一步的改進。外觀 Surface Pro 延續了 Surface 系列的簡約設計風格,整體外觀時尚...

    聯想推出了一款超薄輕便的Chromebox,旨在為數字標牌裝置供電

    近日,聯想在美國拉斯維加斯舉行的年數字標牌展上發布了一款名為Chromebox Micro的新產品。聯想表示,Chromebox Micro是一款超薄輕巧的機身,是一款可以提供高效能的合理 裝置,同時其資料安全性也得到了證明,ChromeOS也可以實現更輕鬆的遠端控制和裝置管理。Chrombox M...

    Genshin Impact 發布!如何挑選一款可以流暢播放 Genshin Impact 的手機

    Genshin Impact 可以說是目前手遊端最火的網遊,也是各大評測老玩家喜歡測試遊戲的標配遊戲之一,基本上只要你的手機能玩 Genshin Impact,說明效能是足夠的,所以應付日常生活是沒有問題的。所以今天,我們也以 Genshin Impact 為標準,給大家介紹哪些手機可以流暢執行 G...

    哈雷計畫投放基於X350平台的小排量泛美車型

    根據最新訊息,哈雷計畫推出基於X平台的小排量泛美車型。X 和 Pan America 都沒有達到哈雷的期望。因此,將這兩種模型結合起來可能會達到令人驚訝的效果。根據日本的 楊機的說法,新機型被命名為XRA,而之前的泛美機型也有類似的字尾,所以有人猜測它就是這麼命名的。雖然訊息尚未完全證實,但從 的角...