2024年即將結束,AI大模型的熱度絲毫沒有減弱。
谷歌一宣布將為開發者提供新版雙子座模型,並承諾降低使用成本,Microsoft就推出了具有27億個引數的新語言模型Phi-2。 當頭部巨頭頻繁移動時,腰部玩家開始擠在一起,如百傲幾何和智浦AI開始聯合構建自然語言-生活語言的多模態大模型。
雖然巨頭等巨頭早在2024年前後就已經布局了大型模型技術,但2024年確實可以算是“大型模型元年”,幾乎所有的頭部技術廠商都深度參與研發,熱錢不斷湧入,將“千模大戰”推向了新的高潮。 然而,除了大模型的“軍備競賽”之外,行業內冷酷的思考也越來越多:基礎的大型模型越來越多,為什麼能夠實現產業化的卻寥寥無幾?2024年,人工智慧技術的產品化、產業化、商業化將是大模型發展的重中之重。
*來自 Unsplash)。
無論從參展企業規模、大型模型數量和市場規模來看,中國已成為僅次於美國的全球第二大模型產業中心。
作為國產大模的“旗手”,李彥巨集在上個月的西麗湖論壇上提到了一組資料:截至今年10月,國內發布的大模多達238款,是6月的整整三倍,而抱臉平台上的大文生成款接近3萬款。 按比例計算,美國和中國已經推出了全球80%以上的在研大型模型,擊敗了其他國家或地區。
據 Sutu.com 測算,2024年中國大車型市場規模約為147億元,同比翻番,預計2024年將突破1000億元。 巨大的市場規模,巨頭們高度重視,資本不斷加大投入人工智慧對提高生產效率和經濟質量具有重要意義,在一定程度上關係到國家的核心競爭力,因此也得到了相關部門的高度重視。 可以說,大模型已經飆公升了整整一年,離不開政策的支援、巨頭的關注和資本的熱情。
我國在大模型技術有序發展方面走在世界前列,國家網際網絡資訊辦公室等七部委聯合印發的《生成式人工智慧服務管理暫行辦法》和北京市科委印發的《北京市促進通用人工智慧創新發展若干措施(2023-2024年)(徵求意見稿)》相繼發布,為大模型開發掃清障礙,提供必要的資源,避免技術的無序發展。
在資本方面,阿里巴巴、騰訊、位元組、科大訊飛、美團、JD.com、網易等各大廠商都在布局大規模模型技術,而實力雄厚的初創企業則成為VC爭相的香包,熱錢源源不斷。 中國新一代人工智慧發展戰略研究院報告顯示,截至10月底,我國已舉辦38場大型模型投融資活動,現有AI企業超過2200家。
*來自殼牌金融)。
在技術層面,文心大模、阿里通益、科大訊飛星火、志璞等國產基礎大模在眾多榜單上均位居評測前列,在一定程度上已經能夠與GPT PK抗衡。
大型模型行業欣欣向榮,但仍存在一些隱憂——比如困擾大多數從業者的產業化問題。 任何尖端技術都必須轉化為產品或應用,才能被人們使用並發揮價值。 目前,AI模型在追趕基礎技術的同時,需要深入工業場景,在企業生產經營或使用者生活習中發揮作用。 事實上,後者是中國人工智慧產業的強項:相較於下棋、畫畫、作詩,中國科技從業者更接地氣,善於將技術應用到場景中,並使其用於產品、應用或服務——即使它不是那麼酷。
大模型產業化存在諸多難點,如不同行業數位化程度參差不齊,不同規模、不同領域的企業對AI應用的需求和成本存在顯著差異。 正因為如此,雖然目前很多企業都在關注大模型技術,但真正能夠利用大模型技術進行業務轉型甚至構建AI原生應用的企業卻寥寥無幾。
但是,我們也可以看到一些大規模模型技術與產業融合的標桿案例。
1、杜小滿軒轅模型:國內首個開源金融模型
資料驅動的金融行業是數位化程度較高的行業,資料庫、儲存、伺服器、自動化、資訊保安等數字基礎設施在金融行業率先得到應用和普及。 在AI技術普及的過程中,金融行業長期以來一直在積極探索AI與客戶服務、風控、授信、營銷等場景的結合,在提公升客戶體驗的同時降本增效。
2024年,大型模型技術將爆發式增長。 金融科技先鋒平台杜小滿5月率先開源中國首個千億級中國金融模型“軒轅”9月,“軒轅70b”開源,開放自由使用。 軒轅作為金融領域誕生的行業典範,在智慧型能力、功能服務、資訊保安等方面具有很強的針對性。
這種針對性體現在很多方面:例如,軒轅用於訓練的資料集包含大量機構研究報告、專業術語、**資料等金融行業資料,這賦予了它強大的金融資訊理解和處理能力。
在技術實力上,軒轅模式也不甘落後。 他通過了註冊會計師考試、銀行**保險**職業資格、財務規劃師、經濟師等金融領域權威考試。 在清華大學、上海交通大學、愛丁堡大學聯合發布的C-EVAL大型語言模型評估榜單,以及Microsoft亞洲研究院、MBZUAI和上海交通大學聯合發布的CMMLU榜單中,軒轅取得了國內所有開源模型的第一名。 C-Eval和CMMLU是目前最權威的兩大專業榜單,能夠同時拿下第一名,對於軒轅這樣的行業典範來說,這絕對是乙個不錯的成績。
軒轅模式正在金融領域得到深入應用。
對內,軒轅模式在營銷、客服、風控、辦公、研發等場景深度賦能,並取得初步成效。 在助手方面,大模型的採用率可以達到42%,這有助於公司整體研發效率提高20%。在客戶服務領域,大模型提公升了25%的服務效率。 在智慧辦公領域,目前大模型的意圖識別準確率已經達到97%。
杜小滿一直非常重視金融科技能力的輸出。 杜小滿CTO徐棟樑透露,軒轅5月開源時,已有數百家金融機構發布試用申請。 從企業客戶的反饋來看,軒轅模式的專業能力是眾所周知的,2版本 0 中上下文對話的時長增加到 8k,也可以為“非利息收入增長趨勢”等金融行業深層次問題提供專業解釋。
2、阿里通益千文大模型,在電商行業實施“AI驅動”戰略。
2024年,阿里巴巴將發生諸多重大變革,“使用者至上,AI驅動”成為新的戰略方向。 4月11日,時任阿里巴巴集團董事長、阿里雲智慧型集團CEO張勇表示,“所有軟體都值得大模型公升級,阿里巴巴所有產品都將接入通益千問。 ”
阿里確實做到了,阿里巴巴的大本營電商業務早已完全AI化。 基於通益千文模型,淘天集團推出了一系列B級和C級AI工具。
B端工具包括官方客服機械人、智慧型生成、營銷配送自監控等,今年雙11大促期間,商家呼叫後端AI工具超過15億次C端方面,AI智慧型助手**上線,上線兩個月受邀試用人數突破500萬人次。 B端工具可以提高商家的運營效率,降低流量成本,而C端功能可以顯著提公升使用者體驗,在電商行業形成差異化競爭力。
大模型與電商場景的結合,阿里走得最快最遠,馬雲甚至在阿里內網回覆中提到了“AI電商”這個令人耳目一新的概念。
為進一步強化大模型技術實力,深化AI與業務融合,近日有訊息稱,淘天集團已秘密組建新的AI團隊,高調高薪招募頂尖AI人才,並抓緊時間為電商行業培養專屬大模型“圖靈”。 根據淘天集團此前透露的訊息,明年將向商家發布更多AI工具,包括AI開店、商務諮詢、智慧型週報等,服務範圍覆蓋商家日常運營的方方面面。 在阿里巴巴的推動下,大模特與電商行業的結合才剛剛開始。 可以預見,2024年頭部電商平台將加大“規模電商”規模。
3、科大訊飛星火模型:大模型+教育的標桿玩家。
科大訊飛的第乙個標籤是語音智慧型,第二個標籤是智慧型教育科技巨頭。 在大規模模型技術出現之前,科大訊飛在AI技術上耕耘多年,其相當一部分營收來自智慧型教育服務,如口語測評、教育硬體等智慧型教育服務。
大型模型技術爆發後,星火大型模型與教育行業的結合更加蓬勃。 今年5月,科大訊飛星火認知模型10版發布次日,A股教育科技板塊上線,除科大訊飛外,學達教育、行動教育、國信文化均跟隨漲停,呈現出“火花燃草原”的態勢。
從 10 到 30、科大訊飛星火大模型一直專注於攻克先進能力和多模態能力,在技術突破的基礎上,為學校、教育企業、教師和學生群體開發了更多的功能和應用。 例如,學校管理過程中的師生資訊化管理、離校複習功能、為教師量身打造的教學課件製作助手、為學生量身打造的AI一對一啟發式對話功能等。 同時,科大訊飛也在翻譯筆、錄音筆、學習習機、辦公書等教育硬體中深度應用大型模型技術,強化產品實力,鞏固在該品類中的優勢。
*摘自科大訊飛星火官方網站)。
金融、電商、教育這三大行業的龍頭,都能在大模型的轉型下獲得新的增長點,說明大模型的產業化不是夢想,而是必然趨勢。
杜小滿、阿里巴巴、科大訊飛剛剛起步,大模型產業化還有很大的提公升空間,特別是在農業、製造業、物流航運、能源等歷史悠久、數位化程度低的行業,亟需擁抱大模型技術,提高生產效率,實現從數位化到智慧型化的跨越。 有鑑於此,加快AI技術的產品化、產業化、商業化將是2024年大模型產業的首要任務。 誰能率先跑完工業化落地路,誰就能在“千模大戰”中笑到最後。 那麼,標桿玩家給大模型的產業化帶來了哪些啟示呢?
首先,有針對性地選擇訓練引數和設計功能服務並不重要。
基礎模型已經很多了,但市場上缺少的是能夠與GPT競爭甚至超越的頂級基礎模型,以及能夠讓千行百業成本更低、門檻更低、應用速度更快的“產業模型”。 要打造強大的產業模式,就必須“既懂AI技術,又懂行業專家”。
杜小滿就是乙個很好的例子,一方面擁有自己所依賴的AI技術基礎,另一方面擁有金融科技行業多年積累的產業認知、能力、場景、生態等資源。
據悉,軒轅雖然是基於1760億引數的綻放大模型進行訓練的,但也離不開杜小滿多年來積累的千億個token中文預訓練資料集,包括銀行、保險、**等行業的基礎知識和龐大引數。 因為後者,軒轅模型具有遠超同類競品和通用模型的金融資訊處理能力,還能針對金融行業的痛點場景提供有針對性的功能服務。
二是要深度“定製”大型模型功能服務,以滿足行業需求,而不是閉門造車。
科技公司容易出現“拿著錘子找釘子”的問題,如果不能滿足真實需求,技術再強大,可能也只是自吹自擂。
為什麼杜小滿、阿里和科大訊飛能先嚐到大型模型產業化的甜頭?因為阿里本身就是電商行業的領軍人物,所以杜小滿自成立以來就深度參與了國內科技金融行業的建設,科大訊飛也深耕智慧教育行業十餘年,對相應行業的了解是普通企業無法企及的。 通過了解行業的運營邏輯和深層次問題,深入了解企業和從業者的真正痛點,為出行提供有效的解決方案。
以杜小滿為例,軒轅大模型基於理解、生成、邏輯、記憶四大基礎能力,整合金融行業的使用習和優化需求,提供一系列針對性功能。 例如,對於個人信用管理服務,軒轅模式為銀行客戶提供客戶歷史資訊管理和多層次使用者需求分析等功能,為使用者提供專業問題的自然語言互動問答服務,從而充分提高雙方的處理效率。 杜小滿在服務金融機構和自身客戶時,洞察了諸多需求,從而做出真正可用、有用、易用的金融模型產品。
第三,大模型不是獨角戲,必須讓行業參與者受益。
中小企業是產業鏈的主力軍,但由於資金實力和人力資源有限,往往難以在第一時間應用新技術,尤其是門檻較高的新技術。 與深度學習習相比,大模型需要海量的算力、海量的資料和龐大的演算法,門檻要高得多,這對於很多企業來說有些是無法企及的。 這對龍頭企業來說是乙個機遇,如果我們堅持走包容開放的路線,不僅可以讓大模型技術有乙個“產業化”的落腳點,還可以在大模型的產業化中獲得相應的價值。
在杜小滿與北京大學光華管理學院聯合舉辦的大模型技術與應用論壇上,杜小滿CTO徐棟樑表達了類似的觀點,他認為大模型是中小金融機構突圍的機會,因為它們可以通過應用創新加速數化、智慧型化公升級的程序, 然後跨越數字鴻溝。
不難發現,“開放性”已經成為成功落地產業大模型的最大公約數。 杜小滿的軒轅、阿里的通益千問、科大訊飛的星火都是開源的、開放的路線。 正如徐棟樑所說,向金融機構開放大模型的能力,不僅可以加速技術的普及,還可以降低使用門檻,是實現技術普惠的必然選擇。
與區塊鏈等新興技術的短暫曇花一現不同,大模型的受歡迎程度不會突然下降。 一方面,2024年大型模型技術將深入更多行業,C端、大型模型驅動的爆炸性現象級應用必將出現,B端、大型模型產業化只會越來越多。 另一方面,大模型技術的本質是深度學習習技術的延續。 人工智慧技術已經發展了 10 多年,並將在未來幾十年內繼續成為技術行業的基礎。 大模型是AI浪潮中最大的浪潮,AI浪潮將繼續激增。