國產大模型落地為王!科大訊飛星火如何才能快一步?

Mondo 科技 更新 2024-02-03

聰明的東西

作者 |程倩

編輯 |沙漠之影

從去年開始,大模型無疑是科技行業的“主角”,而今天,大模型行業的競爭核心發生了變化。

自2022年11月ChatGPT發布引發科技革命以來,到上百款機型的競爭,如今隨著大機型與產業落地的結合日趨緊密,各種應用層出不窮,大機型商業化成為所有參與者的核心目標。 2024年似乎已成為大型車型商業化的第一年。

此前,大型機型受研發成本高、落地場景不明確、部署成本高的困擾,商業化程序緩慢。 就在昨天,在2024年農曆新年前夕,AI國家隊和國內大型模型行業賽道的重要玩家科大訊飛,給出了自己的破局之路。

科大訊飛董事長劉慶峰、研究院院長劉聰正式發布基礎首款科大訊飛星火v35、科大訊飛Spark v35、七大核心能力全面提公升數學、語言理解和語音互動能力超越 GPT-4 Turbo

科大訊飛發布Spark 語音模型在語音識別方面,首批37種主流語言超越OpenAI Whisper V3效果,在此基礎上公升級了可自動識別語言的科大訊飛翻譯器,並首次發布深度適配國產算力科大訊飛星火開源大模型“星火開源-13b”。它已在 Ascend 開源社群聯合推出。

自去年5月以來,以科大訊飛星火認知模型為核心的技術積累和應用經驗,成為科大訊飛大模型商用第一年的重要支撐。

那麼,如何解決曾經困擾大模型商業化的問題呢?科大訊飛眼中大模型的落地場景應該是什麼樣子?科大訊飛是如何一步步走出自己的道路,成為行業領軍人物的?我們試圖從科大訊飛Spark v3中獲取乙個大型模型5 個重磅公升級開始尋找這些問題的答案。

百款大戰的轟轟烈烈的熱潮逐漸平息,但技術變革的深遠影響並沒有停止,科技發展的進步真正與行業相結合,在實際應用中發揮了作用。

根據資料研究和分析公司 Gartner** 的資料,到 2026 年,超過 80% 的企業將使用生成式 AI 的 API(應用程式程式設計介面)、模型或在生產中部署生成式 AI 應用程式,高於 2023 年初的不到 5%。

然而,長期以來,大型模型在行業應用中確實發揮了作用,落地的過程一直非常緩慢。 這與大模型能力、應用落地場景、算力三大挑戰有關。

首先是模型能力的挑戰。 大模型的錯覺、智慧型不足等問題,將直接影響不同行業使用者的接受度。 與消費者不同,企業對資料安全和私隱性、大模型的可用性、生成內容的準確性有著極高的要求,因此除了強大的生成和理解能力外,大模型還需要真正解決行業問題,在業務中發揮作用。

二是應用場景的挑戰。 大模型需要找到乙個有效的落地場景,它在企業內部的應用範圍非常廣泛,需要與大量的內部資料深度融合,找到企業真正的痛點,並通過大模型的能力來解決。 這樣可以將企業最迫切的需求與大模型的能力相匹配,在進一步提公升大模型能力的同時形成豐富的應用場景。

三是算力挑戰。 這不僅包括企業定製和大模型微調的算力成本,還包括國產大模型自主可控的算力基礎。

對於下游企業來說,他們沒有足夠的計算能力來定製和微調大型模型。 算力是大模型訓練和推理階段極其重要的物質基礎,但大模型的繁榮使得算力成本居高不下,中小企業難以維持。 但是,企業要想將大模型與自身業務深度融合,就必須對大模型進行定製和微調,這也成為擺在企業面前的一大障礙。

受國際形勢動盪影響,大型模型產業自主可控國產化也是一大難題。 只有立足自主可控的國產算力平台,才能實現大模型產業的持續良好發展。

隨著這些問題的逐步突破,大型模型的實用性達到了更高的水平,其綜合能力的結合,解決現實世界的剛性需求,已經提上了日程。 在此背景下,在大模型核心能力公升級、商用落地應用、計算平台部署等方面擁有豐富經驗的科大訊飛,成為大模型商業化準備最充分的玩家代表,正在突破成為大模型落地的領跑者。

大模型改變世界的願景逐漸清晰,那麼站在大模型商業化的第一年呢? 科大訊飛有哪些儲備? 以及如何領導? 我們可以從本次發布會的焦點中提煉出今天大模型頭播放器的布局邏輯,也代表了大模型下一次商業落地的競爭焦點。

、科大訊飛Spark v35、實現了文字生成、語言理解、知識問答、邏輯推理、數學能力、高階能力、多模態能力七大核心能力的公升級。 其中,語言理解和數學能力超過GPT-4 Turbo,GPT-4 Turbo的96%和GPT-4V的91%多模態理解能力

這些強大的功能已經顯示出滿足現實世界需求的巨大潛力。

萬物互聯時代,人機互動模式正在重塑,科大訊飛星火APP推出語音互動功能,在與人對話中,可以自動呼叫大模型的外部能力,實現全語音的自然互動。 劉慶峰表示,從DOS介面到Windows介面都實現了Microsoft的傳奇,從鍵盤到觸控都帶著蘋果的神話,這一次全語音的自然互動將帶動整個行業的新景氣

語音技術一直是科大訊飛的強項,自成立以來,公司一直立志讓人與人、機器之間的交流無障礙。 在通用人工智慧時代,科大訊飛繼續保持語音互動的領先優勢,在新技術的浪潮下看到了更多的可能性。 大模型可以通過更統一的多工建模能力,幫助小語言語料庫的訓練,推動語音技術的發展。

科大訊飛星火語音模型基於語音屬性解耦表示,結合常規語音模型架構進行預訓練首批37種主流語言的語音識別效能超越OpenAI Whisper V3在多語言語音合成和超擬人語音合成方面,MOS具有絕對優勢,MOS是指生成的聲音是否自然。

搭載星火語音模式的科大訊飛翻譯器也實現了重大公升級,可實現多語言獨立識別,無需使用者自主選擇即可自動識別說話人的語言並翻譯成中文。

此外,為了豐富大機型的應用生態,科大訊飛還發布了130億引數規模的Spark開源大模型系列,包括基礎模型、微調模型、微調工具和自定義工具。 星火開源-13b在多個知名的公共測評任務中,在文字生成、語言理解等典型場景上名列前茅。

最後,大模型訓練有了堅實的基礎——計算平台、科大訊飛Spark v35、星火語音模型和星火開源模型均基於“飛星一號”訓練飛星一號是國產首個支援萬億引數大模型訓練的計算平台,於去年10月24日由訊飛正式上線。

、科大訊飛Spark v35.是國內的首個基於國家算力訓練的大模型。星火開源模型也基於飛星一號,實現全棧國產適配優化,訓練效率是A100的90%。 這也意味著科大訊飛為企業客戶提供“大機型+算力”的另一種選擇。

在這個特殊的節點上,大模型基於國產自主可控的計算平台非常重要,劉慶峰表示,科大訊飛星火35、是未來國產算力平台能否支撐大模型研發的重要考驗。

可以看出,科大訊飛在大模型行業的浪潮中,非常清楚自己想做什麼,怎麼做,在之前的行業深厚積累中,真正瞄準了行業的痛點,懂得如何扎根這個行業,實現領先。

縱觀整個大型模型行業的發展,如今的商業化之戰不僅是一場全球性的科技競爭,更是國內生成式AI發展的關鍵環節,也是全球同頻。

自去年8月以來,共有4批國產大模型通過大模型備案向社會開放,目前在金融、教育、辦公賽道等領域已有不少大型模型應用。

作為首批通過記錄的科大訊飛星火大型機型,申請進度也不遜色。 自去年5月以來,在星火模式的七大核心能力不斷公升級的同時,硬體打造了教育領域的科大訊飛AI學習機,辦公領域有科大訊飛智慧型辦公筆記本、科大訊飛錄音筆,軟體有科大訊飛聽力、科大訊飛星火APP、科大訊飛輸入法等,以及內容創作工具, 如音訊創作工具“科大訊飛智作”、創作工具“星火內容運營大師”等,逐漸向廣大使用者釋放了大模型的價值。

在科大訊飛開放平台上,大型模型開發者總數超過35萬,其中企業開發者超過22萬。

大量使用者的體驗和反饋,也在反饋大模型核心能力的不斷完善。

同時,劉慶峰表示,大模型不再是用來單純寫詩畫,而是賦能科研、產業、民生讓大模型公升級為數位化時代、智慧型化時代的新生產力

從科技創新到產業落地的距離,需要終端企業使用者與核心大模型玩家的結合,逐步拉近距離,同時讓大模型商業落地的路徑更加清晰。

科大訊飛在不同的賽道上積累了大量的商業化。 針對教育行業,科大訊飛推出Spark 智慧型黑板它具有四大功能:多模態理解和推薦、全自然互動、虛擬人輔助學習、智慧型錄課分享。 該功能進一步拓展了黑板的價值邊界,成為教師的AI助手。

同時,科大訊飛與中國移動聯合推出創新的5G通話應用“商務速記”,可同步通話時語音,細化使用者通話中的關鍵待辦事項。

汽車行業領軍企業奇瑞汽車所應用的智慧型語音互動技術由科大訊飛提供,出口國家覆蓋英語、俄語、西班牙語、阿拉伯語、葡萄牙語等數十種語言。 可以看出,支援中國汽車出海也是國產大型車型商業化的潛在場景。

由此可見大型車型同時帶動B端和C端的商業化一方面,翻譯器、商務5G通話、AI PPT等能力正在被大模型重塑,讓前沿技術創新成為個人使用者的生產力工具。 另一方面,各行各業的龍頭企業和初創企業正在與以科大訊飛為代表的大機型核心企業一起探索商業化,在加速產業轉型公升級的同時尋找新的增長機會。

更重要的是,科大訊飛作為國家級AI團隊,在提供自主可控的國產算力平台的同時,在加速國產大模型商業化方面具有天然優勢。

如今,大模型商用已經匯聚了算力、大模型、終端企業等各方力量,讓大模型的核心能力和應用落地進度同步推進,安全可控。

儘管在大型機型核心能力方面與國外存在較大差距,但已進入商用化新階段,依託中國豐富的應用場景和落地土壤,以科大訊飛為代表的玩家正在引領大機型新時代的轉型。

大模型在生成和理解方面的強大能力,使AI能夠在數千個行業中不斷擴充套件其應用邊界。 目前,各種人工智慧驅動的應用正在改變人們的工作、生活和學習。

但是,從大模型的商業應用來看,如上所述,與C端消費者相比,企業業務整合大模型的能力需要考慮模型能力、應用場景、算力等具體特徵。 這也是當前大型模型產業迭代公升級及其向商業化推進的重中之重。

大模型玩家之間的對抗並沒有停止,從百模大戰的算力和引數來看,如今的大模型已經變得越來越實用。 這背後,離不開企業對前沿技術的深刻理解和勇於探索和嘗試,也離不開擁有核心技術的企業不斷突破和堅定投入。

國內大型模型核心玩家、企業、算力提供商等眾多參與者都參與了新一波大型模型,成為構建大規模商用應用生態的重要參與者,進一步彌補了國內大型模型行業與國外水平的差距。

未來,大模型作為必要條件,在提公升全球競爭力的過程中將發揮關鍵作用,科大訊飛在AI行業20餘年積累的一系列先發優勢,將成為科大訊飛在大型模型競爭的關鍵環節領先一步的重要支撐。

相關問題答案

    科大訊飛劉慶峰談國產大模與ChatGPT4差距僅半年

    在過去的一年裡,人工智慧大模型的普及方興未艾。受ChatGPT影響,包括人工智慧 網際網絡廠商和晶元公司在內的國內各大企業紛紛推出自己的人工智慧模型。那麼,與GPT 相比,國產大模型的差距到底有多大呢?月日晚,科大訊飛董事長劉慶峰在新東方教育集團創始人俞敏紅直播間參加對談節目時表示,相差半年左右。我...

    加速大模型應用 AIGC加速融入多種業態

    事件刺激 經過年中以來個多月的調整,人工智慧板塊已經完成觸底,隨著大模型盈利的爆發疊加利好政策,新一輪 即將啟動。最新訊息 月日,谷歌正式推出全新大語言模型gemini,並針對不同場景發布了 Ultra Pro 和 Nano 三個不同版本。gemini. 的 Ultra 版本在多項功能上超過了 GP...

    AI大模型加速應用,推動多行業公升級創新發展

    黃晟.AI大模型的應用正在加速。月日,國家網際網絡資訊辦公室 CAC 公開發布第三批國內深度合成服務演算法備案清單,共備案演算法項。在此之前,年,國家網際網絡資訊辦公室先後於 月發布 國內深度合成服務備案演算法清單 和 關於第二批深度合成服務演算法備案的資訊公告 前後共備案演算法項,涵蓋虛擬人或D數...

    國產大模去哪兒了?

    工業化是關鍵。文海科金融 範東成.人工智慧領域已經加入了浪潮。月日,醞釀已久的谷歌正式發布了雙子座多模態大模型。官方公告 雙子座 版本 包括 Gemini Ultra Gemini Pro Gemini Nano 這 種不同尺寸,Gemini Nano 主要用於裝置端,Gemini Pro 適合在各...

    製造商如何跨越障礙?

    文 觀察團 新經濟觀察團 自年底ChatGPT引爆市場以來,大模型的風向已經吹了整整一年。金融行業作為天然的資料密集型 技術驅動的行業,成為大模型最熱門的試驗場之一,在全球首個金融模型彭博GPT發布後,大模型被淹沒。在中國,從金融機構到網際網絡巨頭,再到螞蟻集團 新浪數科等金融科技公司,紛紛押注自己...