大觀資料吉大旗垂直模式聚焦行業細分,是企業首選

Mondo 科技 更新 2024-01-30

為了對通用模型和垂直模型的發展方向和應用效果進行深入研究,大觀資料CTO季大琪接受了第一新聲音的專訪,以企業實踐為切入點,共同開發通用VS垂直模型的演進方向。

根據相關**報告,全球最大的大型模型開源社群 Hugging Face 上的預訓練模型數量已從 100,000 個增加到超過 300,000 個。 回到國內市場,根據公開資料不完全統計,截至2024年11月底,國內至少有200+大車型上市,各行各業大車型“落地”。 從統計資料來看,除一般大模型外,金融行業的落地速度最快,近15%的大模型為金融垂直大模型。

大觀資料7月23日推出的“曹志”大模型,是國內首批專用於垂直行業的國產GPT大語言模型,具有自主可控,具有長文字化、垂直化、多語言化特點,擅長長文件撰寫、審稿、翻譯等

大觀資料CTO季大琦表示:“大觀資料一直專注於TOB領域,在金融、製造等行業積累了深厚的專業經驗。 我們採取的落地路線是將大模型引入原有產品中,為客戶提供更有價值的服務。 例如,過去大觀的智慧型文字處理平台IDPS主要偏向於文字提取,需要標註、訓練、調優等複雜步驟才能達到效果。 但是,現在可以使用大模型實現無標籤的自動提取,從而顯著降低了交付成本。 讓企業真正降本增效。 ”

通用模型和垂直模型都有其獨特的功能,它們是互補的。 由於通用大模型具有較強的語言理解能力,因此可以拓寬應用範圍的廣度,而垂直大模型則針對特定行業或需求,在精度和深度方面可以更好地滿足實際要求。 這兩者不是對立的,而是相輔相成、協同發展的。 未來,兩類大模式將共存,成為賦能千行百業的關鍵。

姬大琦也同意這個觀點,“他說通用模型和垂直模型需要有更強的泛化能力,而垂直模型在垂直行業的應用中必須保持較高的精度

在談到通用機型和立式機型的落地空間時,他認為核心區別之一就是在客戶需求方面,不同層次和規模的客戶對大機型有不同的要求。 例如,在TOC或中小型B端企業中,客戶對模型效果的要求較低,但更注重成本控制。 因此,他們可能會選擇使用通用的大型模型來解決一些問題,以便以較低的成本獲得超乎尋常的結果。

然而,對於一些B端大客戶來說,提公升效能的能力可以極大地為他們的業務帶來顯著的影響和價值,因此他們願意投入更多的成本。 這些客戶可能會選擇訓練大型垂直模型,也可以利用像大觀資料這樣的專業垂直大型模型服務來獲得更好的結果。 在這種情況下,客戶的關注點不僅在於成本,還在於如何實現最佳業務成果。

因此,在大模型的應用中,靈活選擇適合特定業務場景的模型策略非常重要。

雖然目前大模型的開發非常活躍和活躍,但在實際實現上仍然存在落地問題:如何找到合適的應用場景

姬大琪說,要想讓大模型技術真正落地,不僅要依靠大模型本身,還要考慮中間的實現過程和通往最後一公里的路徑,即設計合適的產品形態,選擇價效比最佳的,控制機器資源成本, 並最終找到最佳著陸效果。因此,有必要有既了解大模型又了解行業的專業人員來共同解決這個問題。

TOB行業的主要問題之一是監管難度越來越大。 在TOC方面,它還必須面對備案等監管要求。 在傳統的網際網絡時代,可以相對容易地對文字內容進行審查,及時發現和處理一些涉及意識形態的問題內容。 然而,大型模型使監管變得更加困難。 因此,在實施過程中,如何進行有效監管成為亟待解決的問題。 否則可能會導致誤用、誤用或其他潛在的法律問題。 在解決監管問題的同時,我們還需要思考如何讓更多的人從大模型的應用中受益。 總之,如何確保合理監管與促進社會效益之間的平衡,是整個行業需要認真思考和解決的關鍵問題。

客戶提供資料後,大觀資料的工程團隊會根據具體情況進行處理,這一步其實相當順利。 但更棘手的問題是如何結合大模型,充分發揮資料的價值,賦能企業實現更清晰的業務目標。 這需要明確的業務戰略,定義產品的功能和特性,並確保整個過程有效地滿足客戶的需求。 季大琪強調。

因此,當今所有公司面臨的挑戰是戰略性地思考大型模型的應用,並將這些想法轉化為具體的產品設計和實施步驟。 解決這一挑戰需要結合資料科學、業務洞察力和技術專長,以形成全面且可操作的解決方案。 最終,通過深入的戰略規劃和清晰的產品設計,可以更好地利用資料和大模型的潛力,以實現更有針對性和更有效的業務成果。

最後,大觀資料CTO季大琦表示,“我們希望在以下兩點達成共識首先,未來可能只有少數廠商有能力提供高質量的底層通用大模型,而垂直大模型及其產業應用將迎來很多機會和競爭。未來,多個大型模型可能會同時組合,以解決企業內部的各種問題。 其次,企業的目標是用AI來解決問題,而不是簡單地與AI結合。 因此,公司需要考慮人類和機器如何更好地協同工作並解決問題作為起點。 這不是為了使用大模型而追逐大模型”。

相關問題答案

    好訊息!大觀資料榮獲“長三角百家優秀數字案例企業”。

    近日,中國科協年重點學術活動 第五屆中國長三角數字經濟大會 在杭州成功舉辦。本次會議由中國自動化學會 浙江省科協等單位指導,杭州城西科技創新走廊管委會 國科大杭州高等研究院承辦。會上,舉行了 長三角數位化企業強 頒獎典禮大觀資料憑藉 大模型 知識圖譜驅動的智慧型質量平台 經過前期各省市協會和專家組的...

    英偉達主導資料中心利潤,遙遙領先

    一般來說,很難在腦海中記住資料中心基礎設施支出模型,同時還要了解雲和本地支出的趨勢,並對主要 IT 供應商進行評分,以確定誰是贏家,誰是贏家。因此,我們建立了乙個模型來做到這一點,我們稱之為資料中心基礎設施報告卡。我們不會給 商家提供字母數字等級,因為金錢是你保持分數的方式,歸根結底,它是任何市場中...

    Nvidia Jensen Huang 前往亞洲,專注於資料中心和遊戲業務

    英偉達的財報資料簡直令人震驚!收入和利潤增長猛增,令人瞠目結舌。本季度營業收入增長 達到億美元 淨利潤飆公升 至億美元。而且毛利率高達 同比增長 這簡直太棒了!英偉達成功的秘訣在於其資料中心業務和遊戲業務。憑藉雄厚的技術實力和過硬的產品,資料中心業務一路長足進步,為英偉達奠定了堅實的基礎。遊戲業務也...

    大盟資料向科創板備案,前9個月營收447億,同比增長10%

    雷建平 上 月日 武漢大盟資料庫有限公司 簡稱 大盟資料 近日提交註冊,正準備在科創板上市。大盟資料擬募集億元。其中,億元用於集群資料庫管理系統公升級改造專案,億元用於高效能分布式關係型資料庫管理系統公升級改造專案,億元用於新一代雲資料庫產品建設專案,億元用於大盟中國資料庫產業基地建設專案,億元用於...