近日,Examstar發布了測試評估領域首個垂直大模型,在此發布之前已在多個專案中進行了測試。 大模型具有垂直化、場景化、精度高的特點,融合了語言大模型、影象大模型、多模態大模型,可幫助企事業單位解決招聘、認證、人才能力評估等場景,提供更加智慧型高效的解決方案。
2024年是Examstar成立的第10個年頭,專注數字考試領域10年,目前Examstar平台上註冊企業55萬家,共交付157萬**次考試,服務近億考生。 2021年,考星創新性地提出了行業內“認真考”的理念,通過純線上方式實現了**考試和**監考,確保了**考試的公平性; 2023年,Examstar陸續發布了多項基於大模型的功能和解決方案,進一步提公升各類考試場景全流程的效率和準確性。
業界首個垂直測試評估模型的發布,是基於多年的行業洞察和服務經驗,在擁抱領先的大模型技術的基礎上,在測試評估領域的又一里程碑。 在整個考評過程中,大模型可以解決命題、監考、評分、評價等全過程的智慧型解決方案。
在命題方面,LLM智慧型解題,通過對53萬道試題的微調訓練,已經可以支撐大部分通用場景的題目需求,以及171個專業資格考試和專業領域認證的題目需求。 認證專案經過測試後,使用LLM智慧型問題解決可以降低95%的解題成本,解題效率可以提高14倍以上。
在監考場景中,通過手勢識別、面部識別、語音內容監控等方式實現多模態AI輔助監考,並根據一定的演算法將考試中的作弊傾向劃分為多個級別,從而實現分級精準監考,大大提高了初試的監考效率。 基於超過200萬次考試產生的作弊行為資料庫,監考效率提公升10倍。
在LLM評分場景中,經過1100萬份試卷的資料訓練和模型微調,經過專案測度,現在可以通過人工評分實現90%和95%的速度,達到可信和可用的狀態。 可應用於各種主觀試卷的評分,評分效率提高7倍以上。 2024年,我們還將與多家機構開展深度合作,打造行業內大規模LLM評分的試點和標桿。
除了一般大型模型技術廠商外,Examstar還將與清華大學開展多模態大型模型戰略合作,推動大型模型進入行業。 未來,ExamStar將與越來越多的企事業單位開展規模化模型業務的深度合作,探索和優化考評領域的多場景,推動考評領域的高質量發展。