記者 陳佳蘭 廣州報道
近日,美國商務部長吉娜·雷蒙多(Gina Raimondo)宣布計畫限制外國客戶,尤其是中國客戶使用美國雲計算供應商的服務來訓練AI大型模型,美國商務部宣布一項提案,要求美國IaaS(雲服務)供應商向海外公司和個人提供包括AI模型訓練在內的雲服務。 有分析人士認為,此舉將美國對中國科技的制裁推向了新的高度。
一方面,美國對華科技的制裁將AI算力推向了極限雲服務的高度,另一方面,國內廠商自主可控技術的國產化程序正在加速。
1月30日,《中國經營日報》記者從科大訊飛獲悉,國家算力平台“飛星1號”首個成果為科大訊飛星火V35發布,這是第乙個基於國家算力訓練的國家開放大模型。 此外,深度適配國產算力的科大訊飛星火開源模型“星火開源-13B”首次上線,昇騰開源社群聯合首發。
2023年10月24日,科大訊飛董事長劉慶峰提出,科大訊飛星火大模型將在2024年上半年以ChatGPT4為基準。
當時,劉慶峰介紹了科大訊飛Spark V35的語言理解和數學能力已經超過了GPT-4 Turbo,**達到了GPT-4 Turbo的96%,多模態理解達到了GPT-4V的91%。 不過,科大訊飛有信心在2024年上半年趕上GPT-4目前的最佳水平。
國內廠商加速立足國產化,自主可控
近日,美國限制中國AI大型模型廠商通過美國雲服務提供商使用海外算力的訊息引發市場關注。
2022年10月7日,美國公布了中國人工智慧訓練的算力和頻寬限制,從那時起,中國只能使用“閹割版”晶元訓練大型模型。 2023年10月17日,美國商務部進一步頒布規定,中國連“閹割版”都買不到,對可能與中國合作的周邊國家和地區實施嚴格限制。 就在本月,美國商務部進一步提出,美國公司將無法向中國人工智慧企業提供計算能力。 “1月30日,迅飛Spark v35 在發布會上,劉清峰毫不避諱地談到了美國最近禁止雲計算廠商為中國訓練AI大模型的計畫,“無論是訓練還是推理,我們的算力限制越來越嚴格。 在訓練科大訊飛星火認知模型的第一天,科大訊飛就決心構建乙個基於本地化的自主可控計算平台。 ”
為了搶占通用人工智慧時代的發展主動權,科大訊飛較早布局了國內計算基地。 2023年上半年,科大訊飛與華為成立“聯合專項團隊”。 10月,科大訊飛宣布,將與華為合作,打造基於昇騰生態的自主可控的大規模模型計算基地——飛星一號平台。 在此過程中,科大訊飛基於硬體工具和運算元庫進行了數百次優化,進行了大量的bug修正和運算元效率優化,使“飛星一號”算力集群能夠訓練出超大規模的通用人工智慧模型。
1月30日,全國首款公開大模型科大訊飛星火V35次出場。 同時,科大訊飛首款基於國家算力平台“飛星一號”的開源模型——星火開源-13B正式發布。
劉慶峰表示,科大訊飛正式發布科大訊飛Spark V35、既是對科大訊飛在通用人工智慧領域核心技術和創新能力的展示,也是對國產計算平台未來能否支撐大模型研發的重要考驗。
雖然國產晶元和算力受到的限制越來越多,但也可以看出,它正在迫使各方加大對國產算力的投入,而目前的市場也可以看到,國產算力正在快速發展。
2023年以來,阿里雲、華為雲、騰訊雲等多家國內雲廠商紛紛發布了自研AI大模型平台。
在中關村大資料產業聯盟副秘書長閆陽看來,隨著外部高效能晶元和雲服務的限制,國內市場對本地計算資源的需求可能會增加。
廣發**電腦首席分析師劉雪峰認為,自主可控構建國內AI產業鏈的決心有望進一步加強,國產AI大模型的開發應用將大大加強對國產AI算力和模型服務的利用,國產AI算力自主可控建設程序有望加快。
力爭今年上半年趕上GPT-4
它與該公司的上一代GPT-3相同5 科大訊飛Spark v30 發布近 100 天,科大訊飛 Spark v35、再一次迎來了多維度能力提公升。
它不僅符合當時的期望,而且在許多方面都令人驚訝。 劉慶峰介紹,迅飛星火V35、在語言理解、文字生成、知識問答、邏輯推理、數學能力、高階能力、多模態能力等七個方面進行了公升級。 公升級 Spark 智慧型黑板; 首批37種主流語言超越OpenAI Whisper V3,賦能科大訊飛譯器全新公升級,助力溝通更自由,推動萬物互聯時代客服、汽車、機械人等場景人機互動的變革。
根據科大訊飛,科大訊飛Spark V35的能力越來越接近GPT-4 Turbo水平,在語言理解和數學能力方面已經超越了GPT-4 Turbo,在**中達到了GPT-4 Turbo的96%,在多模態理解上也達到了GPT-4V的91%,其中語音的多模態能力已經超過了GPT-4。
劉清峰也坦言,我們必須清醒理性地看到差距,GPT-4在小樣本快速訓練、多模態深度學習訓練、超複雜深度理解等領域的最佳水平還有差距,但科大訊飛星火有信心在2024年上半年趕上目前GPT-4的最佳水平。
值得注意的是,OpenAI 計畫在 2024 年推出 GPT-5,OpenAI 可能已經完成了 GPT5 訓練。 上海市第十六屆人大代表王延峰教授在提交《關於加快建設具有全球影響力的大型示範創新集群的建議》中指出,我國科技企業雖然在大模型領域投入了大量資金,但與“世界一流”產品相比仍存在較大差距。 而且他們還沒有在全球競爭中表現出相應的領先優勢。“就大模型領域的投入和產出數量而言,中國已經追平甚至超過美國,但在大模型的實際應用和產業價值的轉化方面,美國在全球競爭中仍然保持著顯著的領先優勢,它仍然是OpenAI等少數美國頂級科技公司, 真正達到世界級水平的谷歌和Meta,從這次CES可以清楚地看出。“王延峰說。
展望2024年科大訊飛星火大模型的發展,劉清峰指出了三點:第一,要繼續在通用大模型的底層能力上對標國際先進水平,從演算法研究上取得相對更好的結果,包括更小的算力。 今天的通用模型並不一定代表整個人工智慧的未來,還有很多創新要做,比如腦科學互動、對抗網路深度連線等,需要整個創新生態,但我們必須有走在最前沿的勇氣和期待。
第二,2024年要真正讓大模型的數量和質量一起飛起來,不僅要用於行業應用,還要讓許多關鍵技術創新鏈結大模型,中國企業界和科學界有信心實現超越。 劉慶峰說,“第三,高層建築要建在安全可控的平台上,要在獨立可控的平台上實現生態繁榮。 我有信心,從演算法、資料、應用場景到算力,都能構建乙個完全自主、可控的繁榮人工智慧生態圈。 ”
面對美國頻頻出台限制算力出口和使用的政策,劉雪峰也提醒說,由於可用計算資源有限,我國AI大模型的開發和應用程序可能仍會受到影響,國內AI基礎算力差距縮小還需要時間, 特別是在大規模集群訓練和生態建設方面,美國對AI算力和模型服務的限制變化仍存在不確定性。
編輯:吳青 校對:劉軍)。