在國內大模型競爭日趨激烈、難以落地的當下,智浦AI的模型有什麼特別之處?又能給資本追捧的中國大模式帶來哪些不同的思考?
作者 |戰鬥
製作人 |實業家
對於智璞AI來說,在很長一段時間裡,“星捧月”這個詞非常貼切。
前段時間,智浦AI最新融資再次引發廣泛關注,成為關注的焦點。 公開資料顯示,新一輪融資規模已突破25億元,加上前幾輪融資,智浦AI市值已突破100億。
更值得一提的是豪宅投資人陣容,包括社保**中關村自主創新**(君聯資本為**管理人)、美團、螞蟻、阿里巴巴、騰訊、小公尺、金山軟體、順為、BOSS直聘、好未來、紅杉、高瓴等多家機構,以及包括君聯資本在內的一些老股東。
在這場“百模大戰”中,智浦AI無疑是大眾期待的那一款。
然而值得注意的是,目前知璞AI可以商業化的ChatGPT3只有6B版本,以GPT 3為基準5.商用高引數版本之間還有一段距離。 尤其是在阿里正式開源72b引數模型後,知璞也將面臨很大的壓力。
一些值得思考的問題是,智浦AI的優勢是什麼?未來發展的想象在哪裡?以及如何解決它目前面臨的一些問題?挖掘其頻繁籌款的另一面。
1、100億元的估值是多少?
從3月的第一代開源到7個月後的第三代智浦AI的發展非常迅速
在最新發布的第三代基礎大語言模型chatglm3系列中。 官方表示,該機型的效能與上一代相比有了很大的提公升,是10B以下最強的基礎機型。
具體來說,根據MMLU排序,在各種尺寸的模型對比中,chatglm3-6b的得分排名第9,但前8個模型中最小的也是QWEN-14b,規模為140億引數,如果按照gsm8k排序,chatglm3-6b-base甚至排名第三,超過 GPT-35 頁,共 571分。
由此可見,智普AI追趕OpenAI並非空穴來風。
想要更深入地挖掘智璞AI的優勢,就得從國產大模型開發和實現中的諸多問題入手。
一項新技術的價值是幾何級的,而商業化是最直接的檢驗方式。 在國內的大型模型製造商中,可以說大多數還處於技術和開發階段。 對於商業化,它基本上處於探索階段。
智璞AI早在成立之前就服務於B端,目前擁有超過1000家客戶。 可以看出,其產業落地和商業化前景較大。
實現大型模型的另乙個極其重要的前提是資料安全。 作為國內唯一一家完全由內資、國產化的大型樣板企業,智璞AI推出了GLM國產晶元適配計畫,針對不同型別的使用者、不同型別的晶元提供不同級別的認證和測試,能夠真正實現安全可控。
從某種意義上說,這一優勢完全可以捕捉到中央國企和有特殊要求的大型企業。 “國企央企,如果想做樣板能力或准入,知普無論如何都是必然的選擇。 一位業內人士對實業家說。
此外,還有人的因素。 在一級市場,早期投資是對人的投資,這適用於所有創業公司。 智浦AI的“前身”是清華KEG(知識工程實驗室),CEO張鵬畢業於清華大學,獲得電腦科學博士學位劉德兵董事長師從高溫院士,曾任清華資料研究院科技大資料研究中心副主任王少蘭校長是清華大學創新領域的領軍人物。
整體來看,智浦AI具備落地經驗、人才齊全、資金充足、技術好等條件。 這種情況也使它率先在大型模型製造商的競爭中脫穎而出。 然而,這只是外觀。
在路徑選擇方面,與更主流的GPT不同,智譜AI使用GLM,智譜AI提出了新的GLM(通用語言模型)路徑。 訓練效率高於GPT,也能理解更複雜的場景。
在大型模型落地層面,它沒有選擇推出大型行業模型,而是說服行業客戶在通用大模型的基礎上進行微調。 在CEO張鵬看來,只有一定規模的通用大模型,才能實現類人認知能力的出現。
此外,為了提高大型語言模型作為AI代理的效能和能力,清華大學和智璞AI推出了一種新的解決方案AgentTuning,可以有效增強開源大型語言模型作為AI代理的能力。
智浦AI之所以能贏得資本和網際網絡巨頭的青睞,不僅在於其技術,還在於其對路徑、模式、策略的選擇,以及自身大模型底層定位的清晰度。
用CEO張鵬的話來說,智浦AI的全線產品已經對標了OpenAI的產品。
那麼,就目前而言,除了經過驗證的路徑和模型之外,智璞AI還有其他拼圖需要完成嗎?
2. 商業化、AI開源和不可避免的資金
從智璞AI商業授權的模型版本來看。 它目前限制為 6b,即 60 億個引數。 從 OpenAI 的開源模型來看,GPT-3 是乙個擁有 1750 億個引數的自回歸語言模型,OpenAI 對其進行了部分開源gpt-3.5 有 1375 億個引數,其中一些也是開源的。
更值得注意的是,阿里最近還開源了 72b 引數模型。 要知道,目前大規模模型應用大多處於大力產生奇蹟的階段,引數越大意味著落地效果越好。
可以發現,雖然智璞AI作為國內首個開源模型,但擁有強大的技術架構不過,OpenAI的模式規模與國內各大廠商的商業授權仍有一定距離。 而隨著阿里巴巴開源模型引數更大的發布,智綺AI在6B模型中的優勢可能會變弱。
如果你想彌補這個缺點,你需要大量的資金支援。
“如果智浦AI背後也有像Microsoft這樣的金融家,那將非常引人注目。 一位業內人士直言不諱地對這位實業家說。
事實上,隨著AI大模型能力的不斷提公升,訓練引數自然需要改進,對算力和儲存的需求也會增加。 在資金和資源排程方面,這將是乙個巨大的問題。
粗略地說,私有化和部署乙個規模為130b的大型模型,每年的成本接近4000萬,但這4000萬在花費時能帶來多少價值是未知數。 在大型AI模型的部署方面,目前小企業支付能力較弱,大企業要麼自行研發,要麼還處於理解認知階段,很難實現商業化。
錢從哪裡來是乙個亟待解決的問題。
“開源6b模式的部分原因是告訴市場,我有更好的模式,就看你是否願意花錢了。 ”一位業內人士對實業家說。 對於智璞AI來說,開源6B展現實力,拉動投資是更明顯的解決方案。
另乙個解決方案是擴大“朋友圈”。
眾所周知,網際網絡巨頭在計算、儲存容量和資料資源方面都具有很大的優勢。 對於智璞AI來說,這些都需要它投入大量資金來建設。 與巨頭合作可以大大降低研發成本,提高研發效率。 此外,智付AI還可以利用雲廠商的市場地位和渠道,推廣自己的AI技術和服務。
另一方面,由於大模型需要部署在雲上,並按照資料執行進行付費,因此使用者使用模型和資源越多,對雲算力的需求就越大,雲廠商的收入也會增加。 此外,雲廠商可以利用智普AI的技術實力,提公升其在人工智慧領域的競爭力。
一般來說,對於雲供應商來說,他們可以推動自己的雲收入;對於大型模型製造商來說,可以減少基礎設施的投入,可謂是一石二鳥。
目前,智普AI已與阿里巴巴、騰訊、美團等企業展開了一系列合作。
由此看來,智浦AI“星捧月”的原因在於其開放、一體化的商業模式,在國內大模型競爭日益激烈、難以落地的當下,能夠推動大模型落地,加速大模型生態發展。
智浦AI的這個模型也給自己和國產大模型的未來發展帶來了一些新的想象和思考。
三是國產大型車型的未來在首位
“如果該模型可以解雇一半的人,公司將考慮使用它。 在與一位業內人士的交流中,他表達了自己對當前大模型商業化任重道遠的看法。
從客觀上看,目前國內大型模型業態屬於百花齊放,已經開始出現同質化。 這不僅會導致算力等基礎設施的不合理使用,還會造成不健康的競爭。
目前,大規模模式落地的程序緩慢,仍在興起的大規模模式創業熱潮,必然會產生大量的泡沫。 對於國內大型模型廠商來說,以生態的力量推動大型模型的商業化無疑是最佳選擇。
事實上,國內外主流大模型在演算法層面並不存在代際差異但是,在計算能力和資料方面存在差距。
通過大力支援國內通用領域科技龍頭企業開發自主可控的國產大模型,同時鼓勵各垂直領域利用開源工具,在大模型的基礎上構建標準化、可控的自主工具鏈,逐步構建基礎大模型和專業小模型互動共生、迭代演進的良好生態。
隨著大型模型生態的日益完善,也會帶來一些新的變化。
首先是模型質量的提高。 隨著技術的進步和資源的投入,未來的大模型將具有更高的精度、更強的理解力和更廣泛的適用性。 這不僅意味著他們能夠更好地理解自然語言,而且還能夠執行更複雜的任務,例如翻譯、推理、創作等。
二是應用範圍更豐富。 除了傳統的文字處理外,大型模型還將在語音識別、影象生成、理解和推薦系統中發揮更大的作用。 這意味著我們可以在更多場景中享受到AI帶來的便利。
另外未來,大模型將更加定製化它可以更好地滿足使用者的個性化需求。 使用者可以根據自己的實際需求選擇合適的型號,並自定義配置。 這將使使用者能夠更靈活地利用大型模型來解決自己的問題。
在大模型生態系統中,資料將變得更加共享和開放。 機構和企業可以加強合作,共享優質資料資源,從而促進大模型技術的發展。 此次合作將為大模型的開發和應用提供更廣闊的空間。
新一輪的科技浪潮,必然需要一些企業承擔一些使命。 放眼當下,技術架構是大模型問世的重要標準展望未來,要想站在AI大模型的浪潮上,生態建設力量越來越重要。