編輯:編輯部。
OpenAI 會是下乙個嗎?
開源社群的另乙個中心 Mistral AI 剛剛發布了其最強大的旗艦模型 Mistral Large,效能可直接與 GPT-4 相媲美! (但可惜的是,沒有開源)。
Mistral Large 具有出色的邏輯推理能力,能夠處理複雜的多語言任務,包括文字理解、轉換和生成。
在許多主流基準測試中,Mistral Large 擊敗了 Anthropic 的 Claude 2 和 Google 的 Gemini Pro,僅次於 GPT-4!
在LLM領域,格局再次發生了變化。
與此同時,就在今天,AI圈又曝出一則重磅訊息:繼OpenAI之後,Microsoft也將Mistral納入其麾下!
從一開始,公尺斯特拉爾就充滿了傳奇。 成立4周,6人團隊,7頁PPT,8億融資(15億歐元),堪稱是一篇很酷的文章。
創始人Arthur Mensch,1993年出生於法國,在谷歌工作了3年後,31歲離開谷歌,招募了兩名LLAMA模型的開發者,打造了一家未來可以與OpenAI和Anthropic競爭的公司。
乙個由幾個人組成的團隊,用很少的資金,製作了乙個可以與 GPT-4 搏鬥的模型。
現在,在基金所有者 Microsoft 的支援下,Mistral 的下乙個 OpenAI 頭銜得到了確認。
Mistral 不是開源的嗎? 網友們驚慌失措!
如今,在全世界的聚光燈下,公尺斯特拉爾在全世界的聚光燈下,一舉一動都非常搶眼。
有網友發現,公尺斯特拉爾修改了**內容,刪除了所有提到開源社群義務的內容,頓時引起恐慌!
上乙個主頁(左); 當前主頁(右)。
但是,目前沒有必要太擔心。
據外媒採訪Mistral的CEO們,他們未來仍將堅持開源的理念,但同時,他們也會推出最強大的閉源模式,參與商業競爭。
現在他們已經完成了以規模命名的開源模型:Mistral 7B 和 Mistral 8 x 7B 的構建,回饋社群,並構建了一條以大、中、小命名的閉源模型賺錢的產品線。
歐洲最強大的模型就在這裡!
話雖如此,這次發布的Mistral Large可以說是最適合歐洲人體的大型機型。
簡而言之:- Mistral Large精通英語、法語、西班牙語、德語和義大利語,對他們的語法規則和文化背景有深刻的理解。
- Mistral Large 能夠處理 32k 代幣的上下文內容,使其能夠精確、快速地從大型文件中提取資訊。
- Mistral Large 在執行特定指令方面非常精確,這使得開發人員可以根據自己的需求定製內容審核策略——例如,Mistral AI 使用它來對 LE Chat 進行系統級審核。
- Mistral Large 原生支援函式呼叫。 此功能與Mistral AI在La Plateforme上實現的輸出內容限制模式相結合,極大地促進了應用程式的開發和技術堆疊的現代化。
目前,Mistral AI 的這種新旗艦模型僅在 Azure AI 和 Mistral AI 平台上可用。
其中,Azure AI 的定價如下: 輸出為 0024 USD 1000 代幣,輸入為 0008 USD 1000 代幣。
Mistral Large 最令人印象深刻的是它的超強推理能力。
作為旗艦車型,Mistral Large 在常識、推理和知識方面表現出了令人印象深刻的實力。
雖然與 GPT-4、Claude 2 和 Gemini Pro 1 仍有很大差距0基本上已經是乙個失敗的人了。
作為歐洲人的大型模型,Mistral Large 在法語、德語、西班牙語和義大利語中的表現優於 Llama 2 70B 模型。
同時,它也比自己的小規模模型更好。
在程式設計和數學方面,Mistral Large 的能力也很出色。
不僅與其他機型相比有了很大的提公升,而且在主流測試基準中也取得了不錯的成績。
小杯子也來了
相比之下,較小的Mistral Small更專注於優化延遲和成本。
與 Mistral 8x7B 相比,Mistral Small 表現出更好的效能和更低的延遲,使其成為介於 Mistral AI 開源模型和旗艦模型之間的解決方案。
與Mistral Large類似,Mistral Small在RAG和函式呼叫方面使用了創新技術。
此外,mistral 還優化了自己的服務介面:
提供競爭力**的開放式加權端點,包括 open-mistral-7b 和 open-mixtral-8x7b。
推出新的優化模型終結點,包括 mistral-small-2402 和 mistral-large-2402,同時繼續提供未更新的 mistral-medium。
配合Microsoft官宣,Mistral AI腰板更硬
除了公布該模型外,Mistral AI還正式宣布了與Microsoft的深度合作。
而這也是Microsoft繼OpenAI之後,對AI圈另一家頂級模特公司的第二次實實投資。
雖然 Mistral AI 成立於 2023 年 4 月,但已經對歐洲的 AI 格局產生了重大影響。
開源模型 Mistral 7B 和 Mictral 的發布讓開發人員感到驚訝,並在 AI 社群中引起了軒然。
今天來自Microsoft的支援,讓更多的人相信公尺斯特拉爾是下乙個OpenAI。
Mistral AI是一家法國AI初創公司,Microsoft與它的合作無疑讓Microsoft在歐洲也建立了自己的AI業務。
兩家公司合作的目標是彌合基礎人工智慧研究與現實世界解決方案之間的差距。
如果將來建立多年的合作夥伴關係,Mistral AI將可以使用Microsoft Azure的AI基礎設施。
Microsoft的祝福對Mistral AI的意義是不言而喻的。
Mistral AI下一代LLM的開發和部署不僅將大大加快,而且還將開闢新的商機。 總部位於歐洲的Mistral AI將擴大其影響力到全球市場!
具體來說,Microsoft和Mistral AI之間的合作集中在三個關鍵領域:
超級計算基礎結構:Microsoft 將支援 Mistral AI 與 Azure AI 超級計算基礎結構,用於 AI 訓練和推理工作負載。目前,兩家公司尚未披露財務細節。擴充套件市場:Microsoft 和 Mistral AI 將通過 Azure AI Studio 中的 MaaS 和 Azure 機器學習模型目錄向客戶提供 Mistral AI 的高階模型。
人工智慧研發:Microsoft和Mistral AI將探索合作,為選定的客戶開發專有模型,甚至為歐洲公共部門的工作負載開發。
最近,Mistral AI 籌集了 4 美元5億歐元,由技術投資者安德森·霍洛維茨(Andreessen Horowitz)領投。
然而,與美國的競爭對手相比,Mistral AI顯然沒有得到太多的資金。
要知道,OpenAI僅從Microsoft就獲得了超過100億美元的投資,Anthropic從谷歌和亞馬遜獲得了60億美元的資金。
據華爾街報道,去年 10 月,谷歌承諾向 Anthropic 投資 20 億美元**。
因此,這次合作一出,Mistral AI的歐洲版OpenAI的名字就更加紮實了。
而對於Microsoft來說,這項投資也有很多好處——這是它在歐洲人工智慧領域站穩腳跟的機會。
最初,作為Azure雲中歐盟伺服器上OpenAI模型的唯一提供商,Microsoft已經引領了歐洲的AI競賽。
然而,人工智慧在歐洲的待遇不如在美國。
歐洲許多國家對人工智慧持保守態度和批評態度,尤其是在資料保護方面。
如果它是歐洲伺服器提供商的歐洲人工智慧模型,它可能令人放心,也是乙個很好的補救措施。
9個月前成立的傳奇AI創業公司,挑戰矽谷巨頭
Mistral的6人團隊,7頁PPT,種子輪融資時8億融資的故事值得一講。
2023年初,仍在谷歌工作的亞瑟·門施(Arthur Mensch)年僅30歲。
一年後,他離開谷歌創辦了自己的公司,在短短九個月內估值就達到了 20 億美元!
Mensch 於 2020 年初加入谷歌,擔任 Deepmind 的研究員,他的研究重點是提高人工智慧和機器學習系統的效率。 他當時27歲。
後來,他與兩個年輕人蒂莫西·拉克魯瓦(Timothée Lacroix)和紀堯姆·蘭普爾(Guillaume Lample)一起決定成立一家公司,以更有效的方式構建和部署人工智慧模型。
他們認為,在靈活性方面,小團隊可以勝過矽谷的大公司,而開源模型是實現這一目標的工具。
儘管他已經從各種投資者那裡籌集了超過 5 億美元,但與Microsoft支援的 OpenAI、谷歌甚至 Anthropic 相比,他的公司 Mistral AI 仍然有點微不足道。
這些巨頭,以及它們大力支援的巨型獨角獸,已經投資了數十億美元來構建世界上最先進的人工智慧系統。
但Mensch並不擔心與這些龐然大物競爭。
我們的目標是成為人工智慧領域資本效率最高的公司,Mensch說。 這就是我們成立的原因。 」
至於剛剛推出的Mistral Large模型,他認為該模型可以與OpenAI最先進的語言模型GPT-4和谷歌的新模型Gemini Ultra競爭某些推理任務。
Mensch透露,開發新車型的成本不到2000萬歐元(約合2200萬美元)。
Mistral在巴黎總部的辦公室。
相比之下,OpenAI 的首席執行官 Sam Altman 在去年 GPT-4 發布時表示,訓練其公司大型模型的成本接近 1 億美元。
隨著他們繼續以業內最高效的開源模式震驚行業,他們也獲得了Microsoft,Nvidia和Salesforce等大公司的認可。
這些巨頭還通過現金或計算能力收購了Mistral AI的一小部分股份。
隨著 Mistral Large 的發布,他們 7 個月前用 9 頁的 PPT 吹噓的公牛已經完全兌現。
六人團隊就是這樣形成的。
在巴黎綜合理工學院和巴黎高等師範學院學習期間,Arthur Mensch結識了另外兩位創始人Timothée Lacroix和Guillaume Lample。
兩人都是 Meta AI 團隊的成員,Lample 甚至領導了 Llama 的開發。
幾個三十出頭的年輕人已經在法學碩士發展領域擁有豐富的經驗。
當時,世界上,甚至在世界上,擁有構建、培訓和優化 LLM 專業知識的人也不超過 100 人。
另外三位是讓-查爾斯·薩繆利安(Jean-Charles Samuelian)和總部位於巴黎的健康初創公司ALAN的首席執行官查爾斯·戈林廷(Charles Gorintin),以及法國前數字事務國務秘書塞德里克·奧(Cédric O)。
AI科學家,如何創辦自己的獨角獸公司
Mensch身材高大,留著一頭濃密的黑髮,看起來既不像典型的技術極客,也不像通常的CEO。
他的朋友和同事說,他總是一邊喝啤酒一邊和朋友開玩笑。
作為一名體育愛好者,他在 2018 年提交博士學位前的幾個月裡用了不到三個半小時跑完了巴黎馬拉松**。
從很小的時候起,Mensch 就在學術追求和創業之間徘徊。 他出生在巴黎西郊,父親是一名物理老師,父親擁有一家小型科技公司。
這位未來的CEO畢業於法國頂尖的數學和機器學習學校。 他的導師將他描述為乙個熱情和敬業的學生,可以快速掌握他幾乎沒有基礎的專案。
我確實喜歡探索新事物,Mensch 說。 我很容易感到無聊。 」
在攻讀博士學位期間,Mensch 的研究重點是優化軟體,以分析磁共振成像 (FMRI) 系統的三維腦影象,該系統可以處理數百萬張影象。
2020 年底,Mensch 加入了 Deepmind,在那裡他參與了大型語言模型的開發。
2022年,他以第一作者的身份出版了著名的《龍貓**》
這項研究重新定義了 AI 模型的大小、訓練它所需的資料量及其效能之間的關係,稱為 AI 縮放定律。
隨著 2022 年 AI 競賽的公升溫,Mensch 對大公司的 AI 實驗室發表的關於大型語言模型的研究越來越少並與研究社群分享表示沮喪。
ChatGPT發布後,谷歌決定加速追趕。
Mensch 的團隊從 10 人的小團隊發展到 30 人,最終發展成為 70 人的大團隊。
我覺得我應該在事情變得過於官僚之前離開,Mensch說。 我不想在大科技公司中開發那些不透明的技術。 」
在 2023 年春季向投資者提出的初步提案中,Mistral 批評了由開發專有閉源模型的美國公司主導的新興寡頭壟斷。
對於Mensch和他的合作夥伴來說,乙個重要的原則是將他們最初的AI系統作為開源軟體發布,允許任何人免費使用或修改它。
這也是吸引開發人員和潛在客戶的一種方式,他們希望每個人都能更好地控制他們使用的人工智慧。
Mensch 說,儘管 Mistral 目前最先進的模型 Mistral Large 不是開源的
在建立商業模式和堅持我們的開源價值觀之間找到平衡是非常微妙的。 我們想創造一些新的東西,一種新的架構,但我們也想為我們的客戶提供一些額外的產品和服務。 」