大模“套管”新寵再見LLaMA，你好通益千文！

在全球人工智慧大潮中，一場大模型爭奪戰正在悄然展開。這場名為“百人大戰”的比賽，是國內外科技巨頭與AI領域新興勢力的較量。但在這場看似繁榮的競爭背後，卻有乙個不容忽視的事實：國內自主研發的大模型，大多只是西方開源模型的“殼”產品。

這種現象引發了一系列問題：我們真的在自己開發大型模型嗎？國內AI領域的創新能力如何？是時候揭開這種粉飾的面紗，正視國內大型模型領域的真面目了。

全球大模型有閉源和開源兩種主流開發路線。

以 OpenAI 的 GPT 系列為旗幟的閉源代表了商業化和專有技術的結合。開源學派以Meta的羊駝系列模型為代表，象徵著知識共享和技術的民主化。

國內AI領域反應迅速，一時間形成了“百模大戰”的局面。但是，這場戰鬥中涉及的大型模型中，有多少是建立在自主創新之上的？仔細觀察不難發現，大多數所謂的自研大模型，其實都只是站在開源巨頭的肩膀上，稍作調整的產物。

最典型的例子是 Kai-Lee 的“Yi”模型，它被發現只是對 Llama 的膚淺修改——只是改變了兩個張量的名稱。這種抄襲式創新在國內AI行業並非孤例，而是普遍現象。 零和一事的做法，只是隱藏在國產大模型領域已久的一塊遮羞布。

那麼，這種“套管”現象的背後是什麼呢？

它暴露了國家在原創創新方面的短板，雖然擁有巨大的市場和資金投入，但在核心技術的原創性上，我們似乎還在追趕的路上。這種後續創新策略雖然能在短期內快速填補市場空白，但長期來看缺乏持續的創新動力。

同時，這也暴露了國內AI領域對“速見成效”的渴望。在快速增長的市場的推動下，公司可能更傾向於採取快速複製和輕微修改的方法來搶占市場，而不是將時間和資源投入到深度技術創新中。這種策略雖然能在短期內帶來效益，但可能會犧牲長期的技術積累和行業的健康發展。

這種現象也反映出國內AI產業缺乏技術信心，在全球AI技術競賽中，我們似乎更多的是追隨者而不是領導者。這種狀況需要通過加強原始創新、技術積累和人才培養來逐步改變。

中國要想在大模型領域趕超美國同行，不僅要在閉源模型上趕超OpenAI的GPT-4，還要在開源領域趕超Meta的LLAMA。

2024年2月，Meta首次發布羊駝系列款。在這個初始版本中，羊駝系列包括四種不同尺度的模型：7 億、13 億、33 億和 65 億引數。

7 月，Meta 發布了其最新的大型模型 Llama 2（Alpaca 2），其中包括 7b、13b 和 70b 三個引數變體，可免費用於商業或研究目的。

令人欣慰的是，國內廠商也在積極布局開源大模型領域。

近日，阿里雲通益千問的 720 億引數模型 QWEN-72B 宣布開源。截至目前，同益千問已經開源了18億、70億、140億、720億引數的四大語言模型，以及視覺理解和音訊理解的多模態大模型，實現了“全尺寸、全模態”的開源。

可以發現，在引數尺度上，阿里通義千文已經追平了Meta的羊駝2，引數尺度均為700億。

另外值得關注的一點是，國內一些大型模型創業公司也在推出開源的大型模型。例如7月，智浦AI開源CHATGLM-6B和CHATGLM2-6B;同月，百川智慧型開源了百川-7b和百川-13b。

我國擁有自己的開源大規模模型生態系統，對技術和產業的自主性和可控性具有深遠的意義。

這些開源模型為中國科技公司提供了強大的技術基礎，使他們能夠更自信地在全球人工智慧競爭中展示自己的實力。這些開源模型的存在為中國研究人員和開發者提供了更多的選擇和靈活性，推動了國內人工智慧技術的快速發展和創新。這也將有助於減少對外國技術的依賴，增強中國在關鍵技術領域的自主性和安全性。

中國在大模型領域的這一系列行動，不僅是在技術競爭中的閃亮亮相，也是對全球人工智慧格局的重要貢獻。它不僅展示了中國科技公司在大模型領域的實力和創新能力，也為全球人工智慧技術的發展和應用開闢了一條新的道路。

隨著越來越多的中國公司和研究機構加入開源模型的競賽，我們有理由相信，中國將在全球人工智慧舞台上發揮越來越重要的作用。

在大模型領域，是開源還是閉源開發？

如果從商業角度來看，這不是乙個好的判斷。

但是，從人類整體利益的角度來看，開源的大規模模型路線必須更加“安全”。主要表現為：

1、開源模式更容易被公眾理解和監督。

開源模型的透明度使其成為技術民主化的典範，為廣泛的研究人員和開發人員提供了易於理解和使用的工具，並允許公眾參與監督。

這種開放的溝通和協作模式使最新的技術進步和知識能夠迅速普及，確保社會各界對人工智慧發展方向有知情權和發言權。這種互動不僅推動了技術的快速進步，還有助於提高公眾對人工智慧技術的信任和接受度。

2. 避免AGI被科技巨頭壟斷。

大模式的最終目標是AGI，如此強大的力量絕不能被乙個追求利潤的商業公司所控制。

OpenAI的初衷是避免人工智慧被谷歌壟斷。 openai這個名字中的“open”本身就意味著開放和開源。只不過現在OpenAI越來越封閉，這與其成立初衷背道而馳。

為了人類的整體利益，大模型至少應該保持一條開源的技術路線，作為人類的b計畫。

3、開源大模型有利於大模型行業的繁榮創新。

開源模式為初創企業提供了乙個強大的創新平台，降低了進入人工智慧領域的門檻。這些公司能夠在現有先進模型的基礎上，開發定製的改進和應用，從而快速實現技術創新。

這種模式不僅促進了技術多樣性和應用創新，也為整個人工智慧產業帶來了活力和競爭力，加速了新技術的商業化程序，有力地促進了整個行業的健康發展和繁榮。

接下來，我們來看兩個基於阿里通義千文開源模型的應用創新案例。

案例一：大模型+機械人=具身智慧型

隨著智慧型技術的飛速發展，具身智慧型逐漸走進我們的生活。浙江優路機械人科技，一家專注於大模型與具身智慧型相結合的初創公司，在這一領域取得了令人矚目的進展。

創始人兼CEO陳俊波帶領團隊，依託自主研發的第二代具身智慧型模型，致力於將適應性強、泛化性強的通用智慧型大腦融入到每一台專業裝置中。

優路機械人的願景是讓傳統專業裝置智慧型化，而這是具身智慧型時代最大的機遇。中國有數以萬計的傳統專業裝置製造商，他們迫切需要人工智慧系統來公升級現有產品。優路機械人為這些裝置提供了通用的人工智慧大腦，不僅降低了針對每個型號單獨開發智慧型系統的成本，還提高了產品的智慧型化水平。

優路機械人已成功將通益千問開源模型QWEN-7B整合到道路清掃機械人中。這種智慧型清潔機械人能夠通過自然語言與使用者實時互動，理解並執行使用者的指令。這項創新不僅提高了機械人的效率，還增強了其在實際應用中的靈活性。

陳俊波解釋說，他們選擇通義千文模型有幾個原因：首先，它是中國領域最好的開源模型之一;其次，提供了乙個易於使用的工具鏈，用於快速實驗和微調此外，量化模型沒有損失，適合部署在嵌入式裝置上最後，通益千文提供的服務反應靈敏，能夠滿足企業的多樣化需求。

優路機械人的成功案例表明，開源大模型在具身智慧型領域的應用具有廣闊的前景。對於需要演進和適應新資料的應用來說，開源模型無疑是更好的選擇。這不僅推動了具身智慧型的發展，也給相關行業帶來了革命性的變化。

案例2：心智模型

在現代社會，人們面臨著越來越多的心理壓力和挑戰，心理健康成為公眾關注的焦點。針對這一需求，華東理工大學X-D Lab（Heart Beat Lab）團隊，以閆欣為核心成員，致力於開發能夠撫慰和改善當代人心的AI應用。

基於通益千文的開源模型，他們開發了一系列心理健康、醫療健康、教育考試等大型模型，包括心理健康模型MindChat、醫療健康模型Sunsimiao、教育考試模型GradChat等。

特別是MindChat，作為一種心理諮詢工具，就像乙個AI心理諮詢師，為使用者提供及時、安全、便捷的心理測評服務。通過阿里雲魔術社群，使用者可以體驗到這個模型的實際效果。通過分析使用者的文字內容和語氣，MindChat可以與使用者產生共鳴，為他們提供個性化的建議，甚至在必要時推薦真正的人類或心理專家進行干預。

這個專案起源於閆欣和她的老師在餐桌上關於整個社會的孤獨和心理健康問題的對話。基於此，他們決定開發乙個大型心理模型，可以提供情緒出口並維持社會聯絡。

現在超過 200,000 人使用了他們的大模型，並提供了超過 100 萬次問答服務幫助很多人解決了公升學、考研、就業、職場等壓力。

此外，團隊還非常重視使用者私隱保護，採用分布式架構對訓練資料進行儲存和分析，確保使用者資訊保安。閆昕強調，選擇開源模式是為了實現技術的可持續性和適應性，特別是在高度注重私隱的領域，如心理學和醫學。他們之所以選擇通益千問模型，是因為它具有中國領域最好的智慧型效能，提供了易於使用的工具鏈，支援快速實驗和微調，並量化了模型在部署中的效率。

最終，X-D Lab採用了開源和閉源相結合的方式，不僅回饋了開源社群，還以閉源API的形式為現實世界場景提供服務，確保了他們的技術既具有創新性，又能滿足實際應用的需求。通過這種方式，他們希望讓大模型技術為更廣泛的社會群體服務，尤其是那些在心理健康領域尋求幫助的人。

需要指出的是，開源模型是好東西，但有乙個關鍵的前提，那就是開源模型本身就非常強大。此外，這種開源模式將不斷演進，推動整個開源生態系統的技術進步。以千文將軍的模型為例，僅開源了700億引數規模的大模型，是不夠的。相信未來，我們會看到一些千億級引數的開源大模型。

在探索人工智慧的汪洋大海中，開源模式猶如一座燈塔，照亮了前進的方向。這不僅是技術進步的象徵，也是人類智慧共享的勝利。開源大模型的出現，打破了知識和技術的壁壘，讓更多的科研人員、企業乃至大眾分享各代人的科技成果，共同推動人工智慧領域的發展。

然而，我們也應該意識到，開源大型模型的旅程才剛剛開始。未來，我們需要更多的創新、合作和智慧，不斷提公升這些模式的能力和適用性。

我們期待看到更強大、更智慧型的開源模式的誕生，這不僅是技術創新，更是人類探索未知世界的夥伴，攜手共創更智慧型、更美好的未來。讓我們期待在這條充滿挑戰和機遇的道路上，見證人工智慧帶給世界的更多奇蹟。

文字：一團煙和雨資料猿。

大模“套管”新寵再見LLaMA，你好通益千文！

相關問題答案

電視“套娃”收費終於成為歷史，新的套娃不會醞釀

大型語言模型簡介：基於 Amazon Bedrock 的概述

深化AIGC大模型多模態應用，AI Agent加速應用普及

從ChatGPT Lite版看大模型的演進報告

在自研AI通用模型的加持下，vivo藍信千尋專屬智慧型助手正式上線！

大模“套管”新寵 再見LLaMA，你好通益千文！

相關問題答案

電視“套娃”收費終於成為歷史，新的套娃不會醞釀

大型語言模型簡介：基於 Amazon Bedrock 的概述

深化AIGC大模型多模態應用，AI Agent加速應用普及

從ChatGPT Lite版看大模型的演進報告

在自研AI通用模型的加持下，vivo藍信千尋專屬智慧型助手正式上線！

大模“套管”新寵再見LLaMA，你好通益千文！