近日,一年一度的“科大訊飛A展i.特斯特斯科技創新中心研發團隊同台競技1000餘個參賽團體,最終憑藉NLP(自然語言處理)自監督引擎,在比賽ChatGPT生成的文字檢測賽道中獲得第二名。 目前,該引擎已應用於特瑞斯科技創新中心第9章AI演算法賦能平台,為智慧型工廠等垂直場景下的經驗模型轉化提供優化支援。
特斯聯科技創新中心研發團隊榮獲“科大訊飛A”。i.在開發者競賽“ChatGPT生成的文字檢測軌道”中獲得第二名。
iflytek a.i.開發者大賽由科大訊飛發起,中國資訊協、國家智慧型語音創新中心協辦,旨在推動人工智慧前沿科研創新成果轉化,培養人工智慧行業優秀人才,為構建繁榮的人工智慧生態圈貢獻力量。
在過去的一年裡,人工智慧在NLP領域取得了長足的進步,尤其是以ChatGPT為代表的生成模型的出現。 通過學習習大量的文字資料,生成式大模型具有生成高質量文字的能力,這引發了一系列關於文字真實性的討論——傳統上,我們使用語法錯誤和邏輯不連貫等特徵來區分機器生成的文字,但隨著生成模型的不斷改進,這些特徵變得越來越難以區分。 本次開發者大賽也是從此開始的,參賽隊伍需要區分ChatGPT生成的文字和大賽通過演算法提供的人工生成的文字。
針對上述挑戰,特斯特屬科技創新中心研發團隊利用自主研發的NLP自監督引擎,對事件提供的加密文字進行預訓練,提高模型對加密文字的適應性。 最終,基於預訓練的NLP自監督引擎,團隊在評估資料集上實現了99的準確率93%,獲得賽事第二名。
NLP 自監督引擎頁面。
本次大賽有效驗證了特斯科技創新中心打造的NLP自監督引擎的普適性和魯棒性。 事實上,該引擎已在實際場景中得到廣泛應用。 以製造場景為例,在將“師傅”的個人經驗轉化為數學模型時,需要基於NLP分類模型對他的經驗進行處理。 在這個過程中,對經驗文字的理解和抽象尤為關鍵。 為了讓工廠普通資訊人員能夠基於資料自主完成演算法調優,科創中心採用九章演算法賦能平台,基於Chinese-bert-wwm進行模型改進,對策訓練SWA、多樣本、dropout,結合NLP自監督引擎,提供低**甚至無**的演算法孵化能力。
特斯科技創新中心於2024年正式成立,部署在武漢、德陽涇陽、中江縣開州等地,旨在將學術生態與產業生態充分融合,一方面讓學術生態基於產業資料開發相應的預訓練模型另一方面,以共享的方式為行業從業者提供AI所需的算力、資料、演算法模型,讓各種規模、不同AI基礎的企業,通過學術機構開發的模型,以低質量、模組化的生產模式,實現自主智財權演算法的孵化和成熟演算法的呼叫。
德陽景陽科技創新中心自開業一年來,先後迎來了10余家企事業單位,涵蓋能源、金融、製造等領域中江凱州科創中心為多家本土製造工廠提供核心演算法孵化支援,協助其建立和建設數位化應用團隊,幫助其實現產品和運營的數位化智慧型化武漢科技創新中心專注於建築和個人服務領域的人工智慧賦能。
依託科技創新中心,特斯聯期望不斷夯實自身產研能力,為行業提供更多低門檻工具,讓越來越多的領域、企業、個人從智慧型科技中受益。