在大型模型應用爆發之年,誰能率先突圍?
作者 |張凱靜.
編輯 |關於商業的樂趣。
年底,大型模型製造商又出現了一波“肌肉”。
2月1日,在大模型領域一度處於“沉寂”狀態的位元組跳動終於有了新動作,推出了“Coze Button”AI機械人開發平台;與以往聊天機械人的形式不同,“按鈕”更像是Open AI在2023年11月發布的GPTS,允許使用者通過聊天、呼叫外掛程式等方式建立機械人的個性化版本,實現“0**”開發。
微博截圖。
除了位元組領域,獵豹移動CEO傅晟創立的獵戶座之星也於1月21日發布了自己的大機型獵戶座-14B;傅晟強調,在企業應用場景中,獵戶星模型與企業私有資料和應用相結合,可以達到千億引數的模型效果。
還有科大訊飛、360等在 2023 年首次搶購大型車型的製造商現在正在快速迭代;前者最近發布了 Spark 大型模型 v35、後者推出大型模型搜尋應用“360 AI Search”。
不久前,手機廠商也紛紛湧入大型模型賽道。1月10日,榮耀發布自主研發的70億引數端側AI大模型“魔幻大模型”,此後,華為、小公尺、OPPO、vivo、榮耀五家國內主流手機廠商齊聚大模型領域。 與此同時,有傳言稱,大洋彼岸的蘋果正在測試在iOS 18中引入生成式AI功能。
微博截圖。
“百模大戰”似乎並沒有隨著時間的流逝而平息,反而愈演愈烈。 製造商現在在做什麼樣的計算? 2024年的大型樣板賽道會迎來新的重大變化嗎?
ChatGPT並非毫無徵兆地出現。
建立它的 OpenAI 早在 2015 年就成立了,並於 2018 年推出了其第乙個生成式預訓練模型 GPT-1,這也是 ChatGPT 的原始原型。
在此之前,業界的NLP模型(自然語言處理)主要是針對特定任務在大量標註資料上進行訓練,其能力有限。
GPT 在自然語言推理、問答任務和常識推理方面取得了突破,為此它還獲得了 Microsoft 的 10 億美元投資。 隨後,從 GPT-1 到 GPT-2 再到 GPT-3,GPT 的能力在短短 2 年內持續提公升。
OpenAI官網截圖。
2022 年 11 月 27 日,隨著 GPT-3 的發布5、ChatGPT的推出,一款在小圈子裡風靡一時的人工智慧對話聊天機械人,只是第一次被大眾認可。 會聊天、會畫畫、會寫文案、會編輯**,強大的功能讓ChatGPT一經發布就迅速走紅,5天註冊使用者超過100萬,兩個月月活躍使用者達1億,成為史上增長最快的消費類應用。
訊息傳到中國時,一石激起千浪。 人工智慧已經走到了這一步? 震驚的是,在**上出售ChatGPT賬號甚至成了一門生意。 與此同時,看到巨大商機的各界大佬們也紛紛紛下來,表示將盡快推出自己的大模型。
2023年3月至9月,各大網際網絡公司將爭奪該賽道的第一名。 從大語言模型“文心一言智慧型大腦模型”,到阿里巴巴的“通益千問”模型,科大訊飛的Spark模型,再到騰訊的混合元模型,國內三大傳統網際網絡巨頭“BAT”都走到了盡頭。
此外,華為、JD.com、商湯科技、網易有道、崑崙萬維(300418SZ)等陸續推出大型模型產品,甚至中國移動、聯通、電信、長虹等家電廠商、清華、復旦、中科院等科研院所和高校的三大運營商,都紛紛發布自己的大型模型。
華為雲AI***
在2023年5月的中關村論壇上,專家表示,中國“10億引數以上”的大模型數量仍為79個; 據GitHub統計,截至2023年底,國內已經發布了近300個大型語言模型。“百模大戰”不再是謊言。
不過,與外賣行業原來的“百團大戰”相比,“百模戰”對資金的需求更高。
根據英偉達官方資訊,在底層模型的訓練階段,訓練GPT-3需要34天,引數為1750億,使用1024個A100 GPU晶元,為了維持日常推理,OpenAI至少需要3個240,000 A100; 基於這一計算,僅ChatGPT的硬體成本就超過了8億美元
崑崙萬維集團CEO方晗公開表示“如果沒有 2,000 張 A100 卡,這項實驗就不可能實現。” 為此,海天瑞聲、銀賽集團等“AI概念股”甚至相繼發布定增計畫,為訓練大模型籌集資金。
罐頭畫廊。
此時,如何在縮小與ChatGPT差距的同時,盡快找到應用落地的方向,實現自我造血,成為“百模大戰”中每個參與者都要面對的問題。
從商業角度來看,大模式帶來的機會可以歸納為三類:降低成本、提高效率、擴大原有市場需求、創造新的市場需求。
大模型的超人機對話和音訊生成能力,不僅使其在傳統的客服場景中得到廣泛應用,還對遊戲、影視製作等產生了深遠的影響。
阿里巴巴、美團一流的智慧型客服演算法,以及中國移動的“九天模式”、中國電信的遠端聊天模式等,都屬於這類產品,應用場景直接鎖定在智慧型客服、智慧政務等方面。 在2023年亞運會上,科大訊飛與中國移動聯合推出了基於星火模型的5G新通話。
在遊戲、影視製作方面,導演陸川曾在接受採訪時表示,“用AI畫電影海報,15秒的效果比專業海報公司乙個月的效果還要好。 ”
微博截圖。
原有市場需求的擴大體現在傳統服務的公升級上,這也是大模式應用最廣泛的領域。
以傳統搜尋引擎為例,在訪問文心一言後,在搜尋框中輸入乙個問題,給出的不再是鏈結,而是更確定的答案。 基於此,可以通過訪問大型模型來重建地圖、網盤、庫等應用。
擁有大量業務的騰訊也完成了騰訊雲、騰訊廣告、騰訊遊戲、騰訊會議等多款業務和產品的接入騰訊混合模式的測試,並取得了初步成效。
騰訊混元官網截圖。
此外,在傳統教育、醫療、汽車等領域,大型車型也得到了廣泛的應用。
科大訊飛學習機接入科大訊飛星火模型後,實現了AI一對一輔助教學、中英文作文批改、口語對練等功能。 推出工業級醫療產業模式“凌益”; 華為雲盤古車型的賦能,讓新款M7在智慧型駕駛領域“遙遙領先”,超10萬輛,定月超月。
在創造新的市場需求方面,對AI超級助手和AI機械人的需求也在不斷創造。 在前者中,各種通用的大模型,包括文心一言、迅飛星火、通益千文等,都有相應的產品,大部分都能理解使用者的語言語義,並具有影象理解能力,可以通過呼叫軟體API和使用多種工具來幫助使用者完成任務; 後者擁有不少於10家機械人企業,包括優必選、追覓和宇樹,都展出了相關產品。
同義官網截圖。
然而,在繁榮的背後,也隱藏著憂慮。 不難發現,無論是提高效率還是擴大需求,市場上絕大多數應用都具有類似的功能。
以AI學習機為例,除了科大訊飛的相關產品外,接入紫悅大模型的網易有道、接入MathGPT的美好未來、接入銀河大模型的作業幫助、接入文心一言、360智慧型大腦等都有類似產品在售。 在功能上,他們標榜的也差不多,AI一對一輔導,通用AI作業助手,虛擬口語輔導等,從消費者的角度來看,幾乎很難體會到其中的區別。
罐頭畫廊。
雖然每家公司都能拿出一堆排行榜來論證,但自己的大模型得分更高,能力更強; 但當涉及到實際應用時,百分之幾甚至千分之幾的差異仍然讓人懷疑:我們真的需要這麼多大模型嗎?
雖然市場上的大模型令人眼花繚亂,但業界對大模型的發展趨勢已經形成了一定的共識。
創始人李彥巨集曾經說過:“。人類進入AI時代的標誌,不是大量大型模型的產生,而是大量AI原生應用的產生。360創始人周弘毅在今年年初也談到了大模型的發展趨勢2024年將是大規模模型應用場景的一年,將出現“殺手級應用”。
這也意味著大模型和C端使用者之間的距離會越來越近。
Byte 的“扣環”平台就是乙個例子。 根據“趣味解決方案業務”,它擁有無限擴充套件的一套能力,使用者可以通過新增外掛程式來不斷增強定製機械人的能力; 此外,使用者可以將本地檔案上傳到機械人的知識庫進行學習; 建立的機械人也可以部署在不同的社交平台和應用程式上。
按鈕官網截圖。
這無異於為使用者提供了開發自己的聊天機械人的機會,讓更多的人可以參與到AI生態的建設中來。
同時,大模型也在經歷軟硬體整合協同的過程。
在這方面,智慧型手機廠商無疑是行業的代表。 據《趣解商》不完全統計,在國產智慧型手機中,華為Mate60 Pro、小公尺14 Pro、Vivo X100系列、OPPO Find X7系列、榮耀Magic6系列等手機均已搭載大型機型。
除了讓AI助手更加智慧型之外,這些大型模型還有乙個關鍵的應用領域——手機相簿。 原來,要想消滅**中的其他遊客,只能用ps,測試一下自己的技能和技巧; 現在您可以直接應用AI擦除功能,並且可以一步到位,幾乎沒有任何缺陷。
同樣,美圖公司(1357HK)自主研發的AI視覺模型“Fantasy Intelligence”。它與三星合作,允許使用者在 Galaxy S24 系列手機上體驗 AI 影象編輯。 它不僅可以是“智慧型P地圖”,還可以通過使用者給出的**進一步生成“AI繪畫風格”。
微博截圖。
以流動電話為基準的場景是PC(計算機)。。今年1月,聯想發布了AIPC產品,算力支撐能力更強,人機互動更智慧型,嵌入大模型後應用生態更開放。
和金山辦公 (688111SH)是一款可以應用於PC平台的軟體產品。它專注於智慧型文件,可以幫助使用者輕鬆建立辦公所需的文字和 PPT,還可以獨立消化 PDF 等文件並回答有關這些材料的問題。
此外,教育也是乙個重要的應用場景。 科大訊飛、美好未來、作業幫手、網易有道等廠商紛紛將大模型整合到AI學習機中,2023年教育學習平板電腦銷量將暴漲。 而從產品的迭代來看,學習平板的**還在不斷上公升。
罐頭畫廊。
深度科技研究院院長張曉榮認為未來,大型模型可能會向專業化、個性化、低門檻的方向發展。 模型的功能將更加精細,並針對特定領域或特定需求進行優化; 同時,通過提供更人性化的介面和更方便的介面,降低了使用難度,讓更多的人可以參與到基於大模型的開發和研究中。
而且由於算力的限制,大型模型可能更多地部署在雲端和邊緣。 這減少了計算和儲存資源的消耗,並提高了模型的響應能力和可用性。
但無論趨勢如何,它都必須與實際成本相結合; 否則,盲目投資顯然是不可持續的。
360 (601360.)SH)2023年上半年,新興業務“360智慧型大腦”雖然創造了近2000萬元的營收,但仍以9在1億元的總營收中,僅佔21%。
罐頭畫廊。
科大訊飛 (002230.)深圳)預計2023年非淨利潤同比扣除71%-81%,主要由於公司加大了在自主可控平台上研發認知大模型的投入。
此外,如何讓使用者更好地理解大模型的決策過程和結果,提高使用者的信任度也是乙個關鍵問題。
國內大型模型產業如火如荼,美國更是如此。 據《中國人工智慧大模型圖研究報告》報道。在全球發布的大型車型中,中國和美國佔大型車型的近80%。早在2023年5月,美國超過10億引數的基礎大模型數量就已超過100個。
除了知名的ChatGPT外,美國具有代表性的通用模型公司還包括Anthropic、Cohere和Google。
其中,Anthropic被譽為“OpenAI的勁敵”。 其開發的聊天機械人克勞德可以總結大約 7 個在 50,000 字時,它比 ChatGPT 更適合長時間的對話和內容、對大型文件的深入分析以及更快的平均響應時間。
微博截圖。
Cohere的特點是其差異化的定位。 與OpenAI不同的是,它堅定地選擇了TOB路線,提供靈活的儲存和資料私隱保護路徑,強調安全、私隱和定製服務。
至於谷歌,最新的發展是推出AI模型Gemini,其特點是多模態處理和理解複雜邏輯的能力。 在行業標準的 MMLU(多工語言理解)基準測試中,Gemini 是唯一優於人類專家測試結果的 AI 模型。
微博截圖。
北京社科院研究員王鵬認為中美之間的差異主要體現在三個方面:融資水平、基礎模式的發展水平和應用層的發展水平。
據不完全統計,2023年上半年在美國AIGC一級市場,矽谷在人工智慧領域共募集資金約140億美元,佔全球融資總額的55%,平均輪次融資金額為3輪3億美元。 同期,國內人工智慧領域則要謹慎得多,投資事件數量同比下降49%,涉及金額共計61個74億元,同比下降62%。
在基礎大模型開發水平方面,還存在總資料不足、計算資源匱乏、國產大模型場景滲透率有限等問題。 畢竟,就公共資料量而言,英文資料本身佔主導地位,而美國仍在採取各種方式限制中國獲取算力這一核心資源。
至於應用層,中國也處於跟風狀態; 其中,它在辦公、金融和醫療領域落後於美國。
關於商業的樂趣。
針對國內多家廠商聲稱自己的大型機型已經超越了GPT-4,張曉蓉認為:“.從理論上講,一些廠商可能在本土領先於GPT4,但考慮到雙方在演算法、算力和資料資源方面的投入,國產模式全面超越GPT4的可能性相對較小
在他看來,有必要正視國內外大模式的差距,這涉及到技術、人才、資金等因素。
好訊息是,中國市場規模大,應用場景豐富,為大模型落地應用提供了廣闊的空間和條件。 而且資料和場景越多,大模型就越實用。 這讓中國有機會趕上並超越美國,儘管在基礎研發技術方面略遜於美國。
不過,無論是中國還是美國,在大型車型的賽道上還有很多問題需要解決。 最典型的問題是輸出結果缺乏可信度、穩定性和安全性。
對於人類和人工智慧來說,這將是乙個長期的學習過程。
位元組跳動