對於大型模型的應用來說,最重要的是邏輯推理能力MEET2024

Mondo 教育 更新 2024-02-01

編輯部 從 meet2024 量子位元組織 | qbitai

乙個法律案件的事實是否清楚,如何確定它與法律的關係,都是合乎邏輯的。 ”

在meet2024智慧型未來大會上,面牆智慧型聯合創始人兼CEO李大海在談到大模型落地法律行業時,強調了邏輯推理能力的重要性。

他認為,AGI革命是繼蒸汽革命、電力革命和資訊革命之後的第四次技術變革,而作為這一變革的核心技術路線,最重要的是大模型能夠真正應用於生產過程的邏輯推理能力。

作為國內最早製作大型模型的團隊,面牆智慧型在模型訓練過程中,在邏輯推理上做了大量細緻的工作,將其劃分為歸納、演繹、時空等多個維度,並專門一一克服和完善。

據介紹,Facing Wall Intelligence 的 1000 億多模態大模型 CPM-Cricket 可以對標 GPT-35級,同時邏輯推理能力非常突出。 在公開考試的邏輯推理測試中,CPM的總準確率達到6376%,甚至超過GPT-4的6188%。

然而,在各行各業、各企業都看到了大模型的應用前景和價值的同時,如何釋放大模型的更大潛力,推動生產力的發展和轉化呢?

李大海給出的答案是“大模型+代理”。

他將大型模型比作汽車的發動機,為汽車提供動力。 但如果你想製造一輛汽車,你還需要乙個轉向系統,你需要乙個汽車底盤,以及包括內飾在內的所有其他部件,才能真正為使用者提供完整的汽車產品。

李大海認為,在大模型引擎的基礎上,需要疊加一系列上層技術,包括記憶能力、工具使用等,從而帶來越來越廣泛的應用和想象空間,而AI智慧型體(agent)就是這一系列技術能力的載體。

為了充分體現李大海在“大模型+智慧型體”軌道上的思考,Qubit在不改變原意的基礎上,對演講內容進行了編輯整理。

關於Meet Smart Future Conference:Meet Conference是由量子位元主辦的智慧型技術領域的頂級商業峰會,致力於前沿技術的實施和行業應用。 今年共有數十家主流**及直播平台對MEET2024大會進行報道和直播,吸引了超過300萬行業使用者線上參會,全網**總數突破2000萬。

演講要點。 大模型應該能夠真正應用到生產環境中,最重要的是邏輯推理能力,大模型是一場新的技術革命,可以與工業革命、電力革命、資訊革命相提並論,大模型是底層引擎,如果你想做好代理, 需要引擎提供強大的動力輸出,而大模型帶來的最根本的變化就是人機關係的變化,未來兩者會變得更加平等,未來世界將由智慧型體連線智慧型體世界(以下為李大海演講全文)。

大型模型應以邏輯推理為核心競爭力。

Facewall Intelligence是由清華大學Thunlp實驗室孵化的一家大型模型公司,我們的團隊在公司正式成立之前就開始耕耘大型模型領域。 同時,我們還推出了OpenBMB的開源社群,在其中我們為大型模型製作了大量的開源技術和工具。

我們與清華大學和OpenBMB開源社群一起,構建了“一體兩翼”的產學研大模型生態。

Face Wall Intelligence是國內最早製作大型模型的團隊,2020年12月,我們的團隊推出了全球首個中國預訓練大型模型,名為CPM-1。 2023 年 11 月,我們發布了最新的 1000 億多模態大模型 CPM-Cricket,可以對標 GPT-35個級別。

該模型的核心能力在於邏輯推理。

從成立之初,我們就意識到,要真正將大型模型應用到生產環境中,最重要的是邏輯推理能力。 因此,在模型訓練的過程中,我們在邏輯推理上做了大量細緻的工作,將其劃分為歸納、演繹、時間、空間等多個維度,並專門逐一處理和完善。

為了檢驗模型在真實場景中的邏輯推理效能,我們模擬了大模型近三年公開考試的試題,結果顯示CPM的整體準確率達到6376%,甚至超過GPT-4的6188%。在英語GMAT考試中,面對面智慧型大模型的分數是GPT-4的93%,非常接近,有些題型甚至超過了GPT-4。

最近,我們在與法律行業客戶的合作中看到,用例非常關注並依賴於模型的邏輯推理能力。 案件事實是否清楚,如何判斷事實與法律規定的關係,都是邏輯問題。 經過行業客戶的評估,Facewall Intelligence大模型的邏輯推理效能最為突出,完全符合客戶的實際需求。

今天,相信大模型的技術路線已經形成了整個行業的共識,但大家還是要思考,大模型到底是像web3這樣的技術浪潮,還是十年一年的產業變革。

在我看來,以大模型為核心的AGI革命是第四次重大技術變革,可以與蒸汽革命、電氣革命、資訊革命相提並論,至少會持續20-30年。 再過幾年,整個人類社會的生產和生活就會因為AGI革命的演變而發生翻天覆地的變化。

大模型+代理“,創造更多想象空間。

大型模型就像汽車的發動機,為汽車提供動力。 但如果你想製造一輛汽車,你還需要乙個轉向系統,你需要乙個汽車底盤,以及包括內飾在內的所有其他部件,才能真正為使用者提供完整的汽車產品。

因此,在大模型引擎的基礎上,還需要疊加一系列的上層技術,包括記憶能力、工具的使用等,從而帶來越來越廣泛的應用和想象空間,而AI代理就是這一系列技術能力的載體。

智慧型體具有性格、智商、情商、感知、價值觀和成長六個維度的典型特徵,從而適應各種應用場景。 同時,為了讓單個智慧型體發揮更強大的能力,它們還需要相互連線和協調,以處理和完成更複雜的任務。

事實上,在人類社會和自然界中都有群體智慧型的典型案例。 正如我們需要團隊和組織將個人聚集在一起一樣,自然界中的蜂群、蟻群和魚類群也表現出比個體更高的智力水平。

基於這些思路,Facewall Intelligence從2023年6月開始布局“大模型+智慧型體”的技術路線和落地方向,在過去的幾個月裡,它發布了一系列以大模型驅動的AI智慧型體應用框架,我們稱之為Facewall Intelligence的“AI智慧型體三駕馬車”。

第乙個是agentverse代理通用平台。

它構建了乙個豐富的虛擬空間,其中定義了大量具有不同角色和專業能力的代理專家。

當使用者發出請求時,代理會立即啟動分組過程。 這是乙個戰略招聘過程,旨在確定哪些專家應該致力於特定任務。 一旦這些專家組成了乙個團隊,他們就開始就任務的細節進行談判,並明確分工。 協商完成後,進入執行階段,每個智慧型體根據自己的角色完成相應的工作,然後進行整合。

全程還有乙個戰略規劃師,確保所有代理商齊心協力,形成乙個最終產品,與使用者需求進行對比,如果出現較大偏差,則迭代改進。 該框架的普遍性使我們能夠在此基礎上再接再厲,開展廣泛的工作。

第二個是 Xagent 超級代理應用框架。

它是一種超級智慧型,可以分解複雜的任務,並根據動態指令進行任務分配。 它充當代理專家,根據人的需求進行規劃並完成使用者提出的目標。

在此計畫的基礎上,如果使用者沒有輸入足夠的資訊,它將與使用者互動並收集必要的資訊。

在計畫的每個步驟結束時,Xagent 還會在執行每個步驟後評估是否需要額外的工作,整個過程是乙個動態結構。 在基準測試中,Xagent 的功能已經全面超越了 AUOTGPT。

例如,當你向 xagent 傳送命令,“我有朋友週末來訪,請為我推薦幾家餐廳”時,超級代理不會立即列出一長串餐廳,而是會先詢問你的喜好,詢問你是否喜歡安靜的環境或特定型別的飲食來了解你的需求。

它的第一步是與您互動,而不是立即執行任務; 接下來,根據您的回答進行餐廳搜尋; 然後,整理搜尋結果並提出幾個方案,並進行利弊分析。 方案準備就緒後,將顯示為視覺化效果供你選擇。 一旦您做出選擇,它將通過連線的 API 直接為您預訂餐廳。

這與我們通常熟悉的一步問答模式不同,它顯示了座席提供的更好的質量體驗。

三是chatdev多智慧型體協同開發框架。

它可以幫助我們建立乙個虛擬的AI軟體公司,設定具有不同角色的代理,如CEO、CTO、產品經理、程式設計師、設計師等,並通過乙個稱為“對話鏈”的通訊網路將它們連線起來。

這些角色的互動過程與軟體開發的瀑布模型保持一致,包括軟體設計、系統測試和文件。

我們讓這些AI智慧型體按照明確的分工進行合作,通過自然語言進行交流和互動,平均不到3分鐘,平均成本不到3元,乙個簡單的軟體開發就可以完成“比一杯可樂的時間和金錢還少”。

在這項工作中,我們還做了乙個叫做HAI(Human-Agent-Interaction)的功能,它允許人們通過自然語言與智慧型體進行互動,這樣智慧型體就可以獲得足夠的資料反饋,使自己的工作變得更好,這就是我們剛才提到的智慧型體成長的探索。

在短短兩個多月的時間裡,GitHub 上的 ChatDev 明星數量猛增,超過 1 顆80,000,連續多日位居熱門排行榜第一。

大模型和智慧型體之間的耦合非常重要。

Facewall智慧型需要同時做大模型和Agent的

因為大模型是底層引擎,想要做乙個好的智慧型體,就需要引擎提供強大的動力輸出。

在實際應用中,如果發現智慧型體在哪些方向上可能工作得不夠好,就需要在底層有實時反饋,以便能夠及時修改和優化。 單純依賴外部大模型有很多侷限性,兩者之間的耦合非常重要。

目前,我們在“大模型+代理”的技術路線上有很多場景。

在金融場景方面,面牆智慧型與國內龍頭銀行客戶開展深度合作,通過大模型為其“智慧型財富助手”產品提供強大的語言對話和邏輯推理能力,解答使用者在財務諮詢等業務諮詢方面的專業問題。

在法律場景上,面牆智慧型打造大型法律模型,結合代理技術,為法務人員提供強大的助手,協助提取案件要點、澄清事實、梳理法律條款等,大大縮短案件處理時間,提高效率。

中國每年大約有3000萬起案件,但基層法律人員的數量非常有限。 經過訪談,我們發現,平均每個基層法務人員每天要處理3-4個案件,但案件複雜,處理時間會很長,需要訴訟的案件可能會被安排。

三四個月後。 在這種情況下,需要一種法律模式,以更好地幫助法務部門大大提高案件處理效率。

大模型帶來的最根本的變化是“人機關係的變化”。 它使機器能夠通過自然語言以與人類相同的方式相互互動,並進行邏輯思考和處理複雜的任務。

大模型的出現,會讓機器和人類的關係更加平等,每個人都可以擁有乙個AI夥伴,而“大模型+智慧型體”可以幫助人們創造乙個更親密、更了解你的生活智慧型夥伴。

我們相信,未來的世界將是乙個由智慧型體聯動的世界,即Facewall Intelligence提出的“智慧型智慧型網”的新時代。

大模型是第四次技術革命。 每一次技術變革都需要很長的時間:第一次工業革命花了幾百年,資訊革命花了50年左右,我相信AGI革命不會很短。

2023年只是元年,相信還有很多問題需要解決和突破,包括任務規劃、多模態、更高層次認知、更小的模型。

希望行業內各界夥伴共同努力,克服和解決這些問題,讓整個社會和人民的生活更加美好。

相關問題答案

    生活中最重要的是冷靜

    人生是一段跌宕起伏的旅程,就像潮水的起伏,時而波濤洶湧,時而平靜如鏡。當談到成功時,我們需要保持謙虛,不要對我們的勝利感到自滿。當我們失敗時,我們需要冷靜地接受它,不要因為挫折而氣餒。生命的價值在於平靜。冷靜的心態,讓我們在沉浸的喧囂中保持獨立,不被外界的變化所動搖。俗話說,一根竹杖,一雙草鞋,在風...

    2024年是大規模模型應用的春天嗎?知乎“洞察對話”預測未來趨勢

    Techweb 月日報道 年是大規模模型應用的春天?下一代固態電池將帶來怎樣的 電動未來 mRNA技術會給人類帶來什麼更大的想象空間?中國科幻小說會走向怎樣的未來?在 社會時鐘 的驅使下,現代人如何避免與自己為敵?年中國體育能否 返璞歸真 年,中國經濟增長模式應有所突破 人類世 即將到來,人類在其中...

    在世界上,認知是最重要的

    在世界上,認知是最重要的認知是指人們獲取 處理 儲存和應用資訊的能力,是人們認識 理解和應對世界的基礎。以下是表明認知重要性的一些原因 認知影響決策 人們的決策往往受到自身認知能力的影響。認知能力較高的人能夠更全面地思考,權衡利弊,並做出更明智的決定。認知塑造行為 人們的認知能力決定了他們的行為方式...

    軍隊對國家的發展最重要嗎?

    軍隊對國家的發展最重要嗎?在軍隊對國家發展的重要性中,我們必須意識到軍事力量在國家發展中的作用。但是,我們不能忽視其他因素對國家發展的貢獻。雖然軍事力量在某種程度上是乙個國家發展的基石,但它並不是唯一的決定因素。本文將從多個角度探討軍隊對國家發展的重要性。首先,軍事力量確實在 和穩定中起著至關重要的...

    12 27日漲停盤,炒股最重要的是做到知行合一

    最近比賽環境不太好,看得多,動得少。昨日,有兩塊板,博恩集團和佳龍股份。如今,嘉隆在水下出售,博恩股價等待上漲。錯過了董事會的門票 亞視光電 清遠股份。代表主題小票趨勢的滬深指數,相繼被單方面 說明遊戲環境不好。我們所做的二分之一模型通常影響有限。如何做好?關鍵是要掌握二分之一模式的核心要素,才能在...