Microsoft推出了小型型號 Phi 2,其效能優於 Llama 2 Mistral 7B

Mondo 科技 更新 2024-01-29

Microsoft 宣布推出 27 億引數的語言模型 phi-2,並聲稱其效能可以與大 25 倍的模型相媲美或更好。 “表現出出色的推理和語言理解能力,在少於 130 億個引數的基礎語言模型中展示了最先進的效能。 ”

其基準測試結果顯示,在各種綜合基準測試中,PHI-2 僅具有 27 億個引數,在 7b 和 13b 引數下優於 Mistral 和 LLAMA-2 模型。 與大 25 倍的 LLAMA-2-70B 模型相比,PHI-2 在多步推理任務(即編碼和數學)上取得了更好的效能。

此外,PHI-2 的效能與最近發布的 Google Gemini Nano 2 相當,甚至更好。

與現有的開源模型相比,PH-2 反應的“毒性”和偏差也更少。

此前,谷歌的 Gemini 演示**展示了其解決複雜物理問題和糾正學生的能力。 Microsoft研究人員還將PH-2進行了相同的測試,並表示它同樣能夠正確回答問題並使用相同的提示糾正錯誤。

PHI-2 是 Microsoft 小型語言模型 (SLM) 系列的最新版本。 第乙個版本是 PHI-1,具有 13 億個引數,針對基本的 Python 編碼任務進行了微調。 9 月,該公司將重點擴充套件到常識推理和語言理解,推出了乙個新的 13 億引數模型 phi-15. 效能可與大 5 倍的型號相媲美。

Microsoft表示,PHI-2 的效率使其成為想要探索增強 AI 安全性、可解釋性和語言模型倫理開發等領域的研究人員的理想平台。 目前,PHI-2 現在可通過 Microsoft Azure AI Studio 中的模型目錄獲得。

相關問題答案