金猿產品展示 有書ChatBI是一款基於大模型的可信對話式資料分析平台

Mondo 科技 更新 2024-02-01

網易舒凡產品。

本產品由網易書凡交付,參與評選“資料猿年度金猿策劃活動-2023中國大資料產業年度創新服務產品榜獎”。

有書聊天是基於網易自研大模型的對話式資料智慧型助手,網易書凡於2023年推出,旨在實現自然語言對話作為分析,通過日常對話獲取可信資料,大幅降低資料消費門檻,引領資料分析新正規化。 優數Chatbi是資料分析領域的全新解決方案,也是國內首款具有自主研發私有模型的自然語言對話互動產品。 通過自然語言與BI平台互動,就像與另乙個人交談一樣,即使是不懂資料的業務運營,也能快速檢索資料,實現自助式資料查詢分析。

在當前大模型無法 100% 準確的情況下,Chatbi 引入了乙個大模型,以可信的方式克服 AI 錯覺和不穩定,並將其投入生產。

1. 檢索增強技術,提高模型的自適應能力

資料表的字段命名和字段值定義在不同場景下有所不同,常見的基於 LLM 的 NL2SQL 解決方案將建表語句 (DDL) 寫入上下文,提示將表資訊注入模型中。 但是,由於只有欄位名稱和資訊型別,大模型對資料表的理解仍然不夠全面,容易出現字段選錯、字段值格式不匹配等問題。

網易書凡採用檢索增強技術,充分發揮BI系統快速便捷的表格查詢優勢,將更多相關元資料拼接成針對不同問題的提示,顯著提公升了模型對資料表的理解能力。 這種策略使得大模型對資料表的“視野”更廣闊,並具有適配能力。

2、個性化知識配置,適配定製化問疑

不同的業務方會有自己的行業“黑字”或者知識,比如雲**的操作學生經常檢視“最近的分割槽”的資料,但大模型不懂“最近的分割槽”,可以配置最近的分割槽作為提示詞:最近的分割槽=昨天,讓大模型能理解使用者提問中的“最近的分割槽”

為了提高大模型對此類定製問題的適應性,網易書凡提供了個性化知識配置功能及相應的適配演算法,不同的客戶可以根據自己的需求配置知識與問題的內部沉澱,無需重新訓練,客戶可以建立個性化的chatbi產品。

3.模型是自學習的,你用得越多,它就越聰明

ChatGPT 等 LLM 的主要特徵之一是該模型可以發現自己的問題並通過指出錯誤並通過對話來糾正它們。 受此啟發,網易書凡設計了乙個模型自學習流程,chatbi管理員對當前沒有很好地回答的問題進行記錄和糾正。 下次提出類似的問題時,模型可以從更正的內容中重新生成正確的 SQL,因此您使用它的次數越多,它就越智慧型。

Youshu chatbi 已成為推廣“人人用資料,永遠用資料”資料文化的有力工具。 每個人都代表著資料的使用範圍,不再侷限於少數管理者,而是參與企業運營的每一位一線員工; 時間代表資料使用的頻率,資料不再只在月末考核時受到關注,而是作為工作中必須始終依賴的工具。

例如:1)人力資源團隊:過去他們只有乙個IT系統,當需要做員工福利和活動關懷時,要麼讓IT人員拉資料,要麼自找百寶箱維護大excel,要麼時效性難以滿足需求,或者資料滯後。 使用優書聊天作為資料助手,HR團隊可以很好地完成零碎的、臨時的緊急需求,如活動關懷、人才盤點等。

2)業務負責人:可以跟蹤商機、合同、收入、付款,更快速地了解業務情況,協助業務制定銷售策略,並及時調整; 同時,在討論業務方向或產品規劃時,他可以在多維度、不同視角的結合下分析資料趨勢,方便我們及時做出決策,而不是固定的報告。

3)財務團隊:財務和內部審計對所有不是自己產生的資料持懷疑態度,尤其是投資者在季度報告中關注的分析資料,並且有多輪審查。 這種審查驗證、交叉驗證、層層審查非常耗時,所以他們用chatbi幫他們做一輪審查,可以大大提高效率。

借助網易自主研發的大模型,有書Chatbi可以滿足普通使用者的分析需求,具有低門檻、高效率、智慧型化的特點。 實現“對話即資料”,降低資料使用門檻,實現人人都能使用資料。

1)門檻更低:借助大型模型的自然語言理解能力,使用者只需與AI助手進行對話即可獲取資料,提高了使用者的便利性。

2)效率更高:借助大型模型,使用者可以了解使用者需求,從對話轉換為資料庫表格查詢和視覺化圖表,從而提高使用者的分析效率。

3)智慧型化:從人工設計的規則和模型到自動學習的規則,可以處理更複雜、更深入的資料分析任務。

產品全景如下:

從企業實施的角度來看,由於AI大模型存在嚴重的“錯覺”問題,AI給出的答案不一定100%準確,這個問題是無法迴避的。 然而,資料分析是乙個非常嚴謹的場景,對準確性的要求極高,所以為了解決模型的錯覺問題,網易書凡在產品模型上做了四大創新,實現了有書查特比的“可信”保障:

1.需求是可以理解的

Youshu Chatbi使用大型模型能力,準確理解使用者的自然語言問題,理解業務資料,確保每個問題都能準確回答。

2.過程可以驗證

讓查詢過程盡可能透明,清楚地告訴使用者當前查詢結果是基於哪個資料表,並將複雜的SQL查詢過程轉換成100%正確的結構化表示式,用白話告訴使用者獲取這個資料是用什麼邏輯的,即使不懂SQL的新手使用者也能一目了然地看出邏輯是否正確, 並且還可以驗證結果的準確性。

3.使用者可以干預

假設AI給出的當前答案是錯誤的,使用者也可以自主干預,切換到正確的資料表,並將結構化查詢條件更正為正確的條件。

4.產品可操作

使用者可以對大模型進行最直觀的反饋,對查詢結果的壞情況進行標記和優化,並迭代改進模型,使大模型的使用越來越智慧型。 此外,每個業務的常見問題都可以在後台預置,以構建業務自己的知識庫。

使用該產品的客戶或人員總數:

1)在網易內部,有網易雲**等幾個chatbi業務,已經覆蓋了產品、運營、營銷、財務等非技術人員。

2)隨著網易內部產品的成功落地,在幾款Chatbi產品發布後,吸引了震雲科技等數十家外部客戶前來試用。

1.商業價值。

以網易雲**為例,在Chatbi產品上線之前,業務使用者的臨時資料使用和資料檢視需求一般需要由資料分析師和專人負責資料倉儲研發,並計畫解決。 不僅消耗大量人力,而且需求響應不及時,資料需求滯後也在一定程度上影響了業務策略。

ChatBi 產品上線後,需要檢索資料的使用者只需要通過對話獲取自己想看的資料,零門檻,秒級需求響應。 創造至少三個主要業務價值:

1)通過自然語言檢索,大幅提公升資料查詢的需求和人力效率,共計12000+次獲取,假設每個Q&A儲存02 人日,為企業節省 2000+ 人日;

2)借助智慧型資料查詢解決方案,產品、運營、市場等非技術類學生可以嘗試探索和分析資料,賦能更多業務人員,人人擁有專屬智慧型資料分析師;

3)從高頻的臨時資料檢索需求中釋放資料開發人力,幫助開發學生專注於更多核心業務,雲資料倉儲團隊可以積累大量的資料資產。

2.社會經濟效益。

隨著網易內落地的成功落地,產品發布後,吸引了數十家外部客戶前來試用。 各行各業的客戶使用ChatBI產品盤活企業大量現有資料資產,從企業CEO到一線銷售團隊自上而下的人員,可以自由獲取資料、分析探索,為企業數位化建設開闢新思路,為更智慧型的數位化落地開闢新解決方案。

3.技術影響。

作為國內首個自主研發的自然語言會話互動私有模型,專案組成員參與制定了資訊通訊研究院“大型模型驅動的智慧型資料分析工具”技術標準,並申請了3項專利,另有5項專利正在申請中。 網易書凡將於2023年8月舉辦產品發布會,正式發布線上chatbi產品。 產品發布會後,專案組成員在對外活動中分享了ChatGPT的實踐,如第112屆中國計算機聯合會技術前沿(CCF TF)、網易與CSDN聯合舉辦的大資料技術沙龍、上海網易大資料技術研討會等。

產品負責人:網易書凡。

依託網易20多年的網際網絡技術積累,網易書凡推出自主研發、無繫結的雲原生、大資料、人工智慧、智慧型開發等產品,通過構建開放的數智產業鏈生態圈,為客戶提供數智全流程服務。

目前已服務金融、製造、國企等行業龍頭企業400余家,為客戶提供定製化數位化轉型解決方案,幫助客戶打造全面數智時代專屬數智競爭力。

相關問題答案

    金猿案例展:首創證券NoETL敏捷分析解決方案

    aloudata 本專案案例由Aloudata提交,參與評選 資料猿年度金猿策劃活動 大資料行業年度創新服務企業榜單獎 黨的十八大以來,我們不斷加大對金融科技創新的支援力度,擴大金融科技創新在資本市場的試點範圍。同時,年月,證監會發布 行業科技發展 十四五 規劃 指出推動行業數位化轉型發展是兩大主題...

    金猿科技展 訓練樣本集的資料增強技術

    星環科技。本專案由星環科技投稿,參與 資料猿年度金猿策劃活動 大資料產業年度創新技術突破榜暨獎項 評選。為了滿足日益增長的AI效能需求,需要不斷更新訓練樣本集,以訓練和更新AI模型。研究人員不斷建立新的模型結構,提出新的模型訓練技術,使AI模型在特定領域的公共資料集上取得超越人類表現水平的結果,但在...

    金猿資訊創新發展達盟資料庫已成為國家資訊創新事業的核心力量

    新創達盟資料庫本地化。本內容由大盟資料庫提供,參與評選 資料猿年度金猿策劃活動 年度大資料產業本土化優秀代表廠商 武漢大盟資料庫有限公司成立於年,是國內領先的資料庫產品開發服務商,是國內資料庫基礎軟體行業發展的重要推動者。公司為客戶提供各類資料庫軟體及集群軟體 雲計算 大資料等一系列資料庫產品及相關...

    金朗展 中國電池展 儲能電池如何實現12000次迴圈?

    年月日,瑞普藍駿綠色科技日在溫州舉行,會上,由文定科技賦能的重磅新款ah儲能電池電芯震撼發布 其實際容量突破ah,單體電芯能量提公升至kWh,體積能量密度公升級至Wh L,能效達到 並且可以實現,次迴圈 SOH的長迴圈壽命和年以上的日曆壽命,以滿足大型儲能系統的需求。雖然頂層技術可以提高個單元空間的...

    家居用品有哪些種類? 家居用品的分類及詳細說明

    家居用品是家居生活中不可或缺的物品,涵蓋了從日常家務到娛樂休閒的方方面面。以下是家居用品的主要型別及其詳細介紹 .電器 家用電器是提高生活舒適度和生活質量的關鍵。它們可以分為以下幾類 主要家電 如冰箱 洗衣機 空調 熱水器 電視機等,這些都是家庭生活的基礎設施。小家電微波爐 真空吸塵器 榨汁機 電風...