記者李靜北京報道。
12月15日,中科院下屬人工智慧公司雞格推出亞易二號0國產大車型(以下簡稱“雅藝2.”。0“),並發布開源技術報告。
據中科雞格CEO羅寅介紹,雅易10 型號於今年 6 月 3 日推出,6 個月後推出 2版本 0 在模型訓練、特徵技能、領域應用、評估指標四個方面有很多突破。 首先,在模型訓練方面,雅易20 實現了從 70 億個引數到 300 億個引數的模型在訓練資料集方面,從200多噸豐富的多變數資料中提取了約10噸,共計265萬億個token的高質量訓練資料集,滿足模型訓練需求。
《第一財經日報》記者了解到,亞藝模式是企業級通用模式,此前曾為**、層**、科研機構等多家單位提供垂直領域的專業模式服務。 雅藝 20 發布後,基於 Yayi 20 中科文格在安防、金融、輿情、法學、中醫藥等領域打造了多個行業範板應用。
中科甕格董事長王磊表示:“如今,大模型在國內也如雨後春筍般湧現,但真正本土化的國產AI模型卻很少,人力、人才、算力、演算法、資料與國際先進水平還有較大差距,國內AI產業仍處於發展初期。 ”
從目前的大模型領域來看,市場上已經有ChatGPT、LLAM等大模型,但王磊認為,我國還需要自己做原生訓練大模型,主要有三點答案:一是目前國內基礎原生大模型極其稀缺,自主研發能力不足,開源模型能力不穩定, 中文支援比較薄弱,語言支援比較少,安全性不夠,無法在嚴格的生產環境中使用。其次,很多政府和企業的重要部門需要自主、可控、安全、可靠的原生模型,因為開源模型是乙個黑匣子,在預訓練階段,資料的質量和質量不可信,這會導致模型在出生時就沒有安全感。 同時,在應用於政企場景時,二次訓練的可操作性不強,制約了應用和發展。 第三,大模型是大算力、大資料、大演算法融合的大工程,是乙個巨大的工程,下一代技術創新需要研發經驗的積累。
事實上,亞億大模型的研發已經取得了多項硬核技術成果。 首先,國家生產的基本模型,資料模型完全由我們的工程師和年輕科學家團隊自主開發,並從頭開始預訓練。 其次,非常重要的是,我們積累了兩個非常重要的AI資料集,乙個是海量高質量的預訓練資料集,另乙個是領域微調指令集。 王磊表示,“但還需要看到的是,在一些新的行業應用中,多輪對話、長文字朗讀、多模態智慧型互動、內容安全可控、智慧型外掛程式自動呼叫等,這些工作還需要做一些技術探索。 ”
人工智慧分為通用型和專業型,其中通用型人工智慧分為低、中、高三個層次,現在無疑處於低階,但在這個層次上正在逐步發展和向中等程度演進,大模型的演進趨勢非常明顯。 南開大學經濟研究所所長、中國新一代人工智慧發展戰略研究院首席經濟學家表示,從大模型在各行業的應用來看,落地時有兩個重要影響因素。 首先是容錯率,內用高,外用低,這決定了該模式在行業中的應用。 二是市場規模,使用時會先解決頭部問題,再解決長尾問題。
北京銀行首席資訊官龔衛華談及銀行領域大模型的落地情況,表示:“目前,大模型各有優勢,也有一些不足。 因為大模型裡有很多東西是無法解釋的,而且存在模型黑匣子,作為銀行,如果直接用大模型的能力來服務客戶,風險還是非常大的。 因此,在短期內,大模型的直接外部服務會減少,但在內部,我們願意在各種場景下進行訓練和探索。 未來,相信隨著科技倫理的治理,國家關於模型應用的法律法規將逐步成熟,大模型的應用將更加成熟。 ”
此外,可以清晰地看到,人工智慧的萬億級賽道正在從感知智慧型向認知和決策智慧型躍公升,人臉識別等視覺識別技術的企業上市,標誌著感知智慧型市場變得很大。 隨著ChatGPT的發布,認知智慧型市場近兩年進入加速變現期,未來決策智慧型的市場空間更大。 王磊說。
編輯:張景超 校對:閆景寧)。