在十個人工智慧應用中,五個是辦公室代理,三個是AIGC,2%是恢復活力的數字人。 “那麼,智慧型體是大型模型的AGI終局產品嗎?
作者 |戰鬥
編輯|皮燁
製作人 |實業家
今年4月,史丹福大學和谷歌的研究人員建立了乙個“西部世界模擬”,其中25名智慧型體執行類似人類的日常行為,例如醒來、做早餐和上班、藝術家繪畫和作家寫作。
這些就是今天人們談論的“AI代理實驗”。 今年下半年,在中國,大型模型市場的參與者似乎正在轉向AI Agent,這是乙個清晰可見的AGI終局遊戲。
一組資料顯示,截至11月中旬,AI代理賽道共發生13起融資事件融資總額約735億元企業融資平均為5654億元人民幣。
在國外,這個領域也很熱門。 “至少有 100 個專案正在努力將 AI 商業化**,近 100,000 名開發人員正在構建自主代理。 外媒mattschlicht曾說。
為什麼AI代理如此受歡迎?
關於AI Agent的想象力,乙個備受讚譽的答案是:“大型語言模型只能製造一條蛇,而AI代理可以製造榮耀之王。 ”
成熟的AI代理可以顯著降低軟體生產成本。 未來,在編碼工作流程中,會有很多代理編寫的軟體和測試解決方案,他們不追求長期的解決方案可重用性,可以使用和丟棄。 目前,乙個軟體行業巨頭往往擁有數萬甚至10萬人,在擁有AI代理後研發和交付所需的人力和資金將大大減少。 它使軟體能夠靈活地滿足更多的長尾需求。
此外,人工智慧代理可以為LLM構建乙個框架,以深入思考和分析,以做出更複雜和可靠的決策。
簡而言之,正如Microsoft創始人比爾·蓋茨所說,“誰主宰了私人助理經紀人,誰就大不了。因為你永遠不會去搜尋,你會很有生產力,你會去亞馬遜。 ”
值得注意的是,在這場巨大的技術變革下,目前我們仍然沒有體驗到AI代理帶來的紅利和變化。 顯然,AI智慧型體的開發仍然存在一些困難。
一些值得一問的問題是,目前國內外AI智慧型體的發展現狀如何?AI代理的實施要點是什麼?人工智慧代理的未來會怎樣?
1. AI代理的現狀,海外與本地
目前,國內一些科技公司已經生產了幾款知名的大模型,因此培育劑應用逐漸進入大眾視野。
例如,將文心模型應用於智慧型搜尋和自動駕駛阿里將通義千文模式應用於高德地圖、優酷、盒馬等產品。 華為將其盤古模型應用於智慧型氣象、語音識別等領域。
一家名為Facewall Intelligence的初創公司推出了他們的AI代理產品chatdev,它可以在短時間內完成軟體或小遊戲的開發,使用者需要做的就是向它提供乙個需求。
值得注意的是,協同辦公領域似乎是巨頭做AI代理的“必去之地”。
例如,在釘釘魔杖套件中,釘釘AI產品能力匯集了聊天AI、文件AI、會議AI、易達AI、TeamBitionAI等騰訊會議中的“會議助手”功能提供了一些智慧型支援,例如會議紀要的自動摘要、轉錄和翻譯智慧型工作平台如流搭載文信大模型,可實現智慧型創作、智慧型推薦等功能位元組跳動旗下的辦公軟體飛書宣布推出智慧型AI助手“myAI”,旨在提公升團隊協作效率。
有投資者調侃**:在十個人工智慧應用中,五個是辦公室代理,三個是AIGC,2%是恢復活力的數字人。 ”這不僅是國內AI代理發展的現狀,也是谷歌、Microsoft等國外一些公司也在將AI代理投入到協同辦公場景中的事實。
事實上,在海外,AI智慧型體的概念從出現到爆發,經歷了許多階段。
在單智慧型體階段主要針對不同領域和場景的特定任務開發和部署專用代理。 以 gptengineer 為例,給它乙個需求,它就可以寫出乙個粗略的 **。
還有多代理合作階段,沒錯具有不同角色的座席會自動協同工作以完成複雜的任務。 例如,在 metagpt 上,如果你讓它做乙個工單分析工具,它會將這個任務翻譯成產品經理、架構師、專案經理等五個角色,模擬整個軟體開發中的所有決策工作流程。
然而,隨著Microsoft新工具Autogen的發布,AI Agent很快開啟了新的篇章。
Autogen 允許多個LLM代理通過聊天解決任務。 LLM 代理可以扮演各種角色,例如程式設計師、設計師或角色組合,對話過程解決了任務。 這與 Metagpt 不同,Metagpt 定義了角色模型,而 Autogen 允許開發人員定義自己的代理,並允許他們相互交談。
這是乙個新的、創造性的代理框架。 在Autogen發布後的兩周內,星星數量從390顆飆公升至10K,並在Discord上吸引了5000多名成員。
Microsoft 在 AI Agent 中的布局較早。 Microsoft 365 Copilot 於 2023 年 3 月發布,引發了一種基於 LLM 的應用程式開發正規化,稱為 Agent。 目前,Microsoft CopilotStudio 已支援自定義 ChatGPT 助手無縫整合到 CRM、ERP、OA等日常辦公系統中。
可以發現,Microsoft的AI代理能力主要來源於自身業務Autogen 更像是其自身基於業務的能力的向外發布,這與 OpenAI 不同。
OpenAI 開發的 GPTS,以及 GPT-4Turbo 和可定製的 AI Agent,這樣每個人都可以構建自己的大型模型應用程式。 不少業內人士認為,超低的創作門檻和與App Store相同的商業模式,將使OpenAI能夠快速構建GPTS生態。
OpenAI 提供了構建基本代理的能力,例如工具呼叫和知識庫檔案記憶體功能。 該產品的發布,讓AI智慧型體進入了乙個新的階段,即為大家提供了構建自己的智慧型體的可能。
值得注意的是,目前,AI智慧型體架構和產品已經出現在零售、房地產、旅遊、客戶服務、人力資源、金融、製造等多個領域。
例如,零售領域的亞馬遜 Alexa、Aktify、Regie人工智慧等;房地產領域的Epique、PropertyPen、ListingCopy等;Agent4, EBI. 在客戶服務領域AI、JasonAI、AIDE等;人力資源領域的自主聊天機械人、AiinterviewCoach、CareerSai等。
整體在底層技術、架構、具體產品應用等方面,AI代理比較完整。 OpenAI、Microsoft和谷歌等科技巨頭擁有先發優勢。 另乙個可以看到的現象是,中國AI智慧型體的深度和廣度還存在差距。
乙個值得思考的問題是,代理實現的關鍵是什麼?
二、代理落地的關鍵:
型?行業經驗?還是運營商?
目前市場上的大多數代理,包括OpenAI推出的GPTS,實際上只是基於特定的知識庫或專業資料構建聊天機械人。 這些代理主要用於問答互動,例如獲取行業資訊和報告。
然而在方案聯動和操作方面還有很大的改進空間。 目前,我們無法直接使用GPTS來操作SAP或金蝶等ERP系統,因為這涉及到API管理軟體的應用、授權、維護和連線。
對於企業來說,如果像GPTS這樣的AI代理只用於知識答題,那麼它們的作用將非常有限,就像玩具一樣,因為它目前無法滲透到企業的業務流程中。
這背後有很多原因包括模特能力、行業經驗、場景契合度等,都會影響代理的能力。
AI 代理需要具備感知環境、做出決策和執行適當操作的能力。 這些關鍵步驟中最重要的是了解提供給代理的內容,對其進行推理,計畫它,做出準確的決策,並將其轉化為可執行的原子操作序列,以實現最終目標。
目前,許多研究利用LLM作為AI智慧型體的認知核心,這些模型的開發為完成這一步驟提供了質量保證。 因此,基於 GPT-4 的代理行為更加智慧型。
但就目前而言,包括 GPT-4 在內的所有大型模型仍然需要改進。
“基礎模型仍然存在很大的問題,我們必須等待更好的模型才能讓AI代理真正落地。 ”一位身處大型模型技術一線的業內人士對實業家說。
然而,為了解決模型能力不足的問題,智璞AI和清華KEG提出了一種對齊智慧型體能力的微調方法AgentTuning,它使用少量資料對現有模型進行微調顯著激發了模型的智慧型體能力,並能保持模型原有的一般能力。
AI Agent 的行業經驗對其實施也至關重要。
如果乙個**提出了某種不同的訓練方法,OpenAI 內部的 Slack 會嗤之以鼻,因為這些都是我們玩的剩菜。 但是,當新的AI代理**問世時,我們將進行嚴肅而激動人心的討論。 這是 OpenAI 聯合創始人 Andrej Karpathy 最近的一次演講。
總之基於大模型,我們能做出什麼樣的東西,還是要看行業經驗,而這正是OpenAI等很多大模型巨頭所缺乏的。
要知道,要引入AI代理進行流程優化,企業必須在成本控制、投資預算、效率、安全控制等多個方面經過嚴格嚴格的評估。 就是這樣技術供應商需要提供平台級解決方案,而不僅僅是一心一意。
1. 為各個場景提供.AI代理自動化解決方案。
大型企業引入新的人工智慧技術不允許任何試錯成本,因此技術供應商提供的解決方案必須是具有行業專業知識術語和業務規則的真正代理數字員工。 只有這樣標準化的AI代理才能納入企業內部的建立,進行統一管理和排程。
例如,醫療行業的AI代理需要具備醫學知識,能夠理解和處理醫療資料。 金融行業的人工智慧代理需要具備金融知識,並能夠理解和處理財務資料。
AI代理的實現效果也受到應用場景的限制。 在旅行預訂中,由於豐富的 API 等問題,AI 代理表現良好。 然而,在法律助理等場景中,由於新知識的頻繁湧現和API的不完善,實際應用面臨更多的挑戰。
這從國內AI智慧型體在協同辦公平台的增長中可以看出。
事實上協同辦公平台本身擁有良好的API介面和外掛程式系統,可以更輕鬆地將大模型整合到現有工具中。
此外,許多企業和組織都在使用協作辦公軟體,這意味著大模型可以快速觸達大量潛在使用者。 廣泛的使用者群可以加速大模型的迭代和優化過程,更好地滿足使用者需求。
還有大量的資料資源有助於提公升模型的效能,豐富的場景也可以促進大模型技術的不斷提公升。
釘釘、飛書、企業微信在作為代理載體時,也有著不同的優勢。 釘釘提供了完整的組織架構管理功能,可以輕鬆建立、管理和調整團隊架構,使企業能夠快速構建符合其需求的組織架構。
飛書強調實時協作和溝通,支援多人**編輯文件、一起討論等功能,幫助團隊高效完成協作任務。 其獨特的整合使整個辦公流程更加標準化。
企業微信與微信互通,借助微信龐大的使用者資料和應用場景,其AI代理可以提供更加個性化、場景化的服務。
從這個角度來看,國內AI代理在協同辦公領域集聚是很自然的。 而更重要的是找到乙個合適的場景或載體來實現AI智慧型體。
然而,除了協同辦公之外,還有很多其他載體可能更適合AI智慧型體的落地應用。
例如,智慧型客服、智慧型助手、RPA、CRM等。 具體來說,在智慧型客服方面,AI坐席可以自動回答使用者的問題,處理投訴和建議,提高客戶滿意度和效率。 在智慧型助手方面,蘋果的Siri、谷歌的谷歌助手、亞馬遜的Alexa都是智慧型助手的代表。
在智慧型流程自動化方面,許多企業使用智慧型流程自動化工具,如UiPath、Blueprism等,對某些業務流程進行自動化。
在智慧型營銷方面,許多營銷平台都整合了 AI 代理,例如 Hubspot、Salesforce 等。 這些平台的AI代理可以通過資料分析和機器學習技術,提供精準的營銷建議和**,幫助企業更好地了解客戶需求,提高銷售業績。
總而言之模式能力是核心,行業經驗是關鍵,載體是保障。 無論是模型能力、行業經驗,還是運營商,都是AI Agent落地的關鍵。 值得注意的是,國內軟體行業倒逼國內廠商打造定製化、個性化能力,驗證了國內企業在技術落地方面的潛力,將進一步推動代理商落地。
3. AI Agent的終局是什麼?
在文章的“西部世界模擬”部分,這些智慧型體可以與他人和環境交流(注意彼此的行為,發起對話或問候),反思這些觀察結果(形成獨特的個人觀點),並制定每日計畫。 他們有自己的記憶和目標,產生可信的個體和新興的社會行為,而這些行為不是通過預先設計實現的。
例如,從使用者指定的單個任務開始,即乙個AI智慧型體想要舉辦乙個情人節派對,AI智慧型體會自發地傳播邀請,結識新朋友,互相預約參加聚會,並協調在合適的時間出現在派對上。
這是代理專案中的代表性應用程式。 人們之所以對這個專案感到驚訝,是因為智慧型體的互動是人類意想不到的。 在AI Agent爆發後的一段時間內,人們普遍認為,彌補大模型短板的AI Agent更具實用性,將成為大模型的重要落地方向。
隨著代理的建設越來越簡單,代理生態的成熟會讓C端代理百花齊放,代理在使用者面前會更加腳踏實地,引發新一輪的爆發。
但就目前而言,該途徑的商業化存在許多問題。 以遊戲場景為例,目前收費主要針對**遊戲裝備、**等方式。 然而,AI代理的價值並不能體現在這些固有的變現渠道中。 而從目前代理落地的效果來看,如果沒有顛覆性功能,就不可能知道 C 端使用者是否會為此付費。
更值得注意的是,隨著C側藥劑的氾濫,其應用價值也隨著邊際效應而趨於變小。 換言之,AI智慧型體能否成為AI大模型從C端商業化爆發的最核心應用方向,還需要時間驗證。 而即使成為未來C端商業化爆發最核心的應用方向,其“壽命”也不長。
事實是,AI代理的最終立足點可能在B端。
比爾·蓋茨(Bill Gates)認為,代理作為下乙個平台,將影響人們使用軟體的方式以及編寫軟體的方式。 它更擅長為使用者查詢資訊和總結資訊,並且能夠為使用者找到最優惠的價格,並將取代搜尋和電子商務,以及文字處理器、電子產品和其他生產力應用程式。 此外,搜尋廣告、廣告社交、購物、生產力軟體等,現在都是獨立的,都將成為智慧型孿生的業務。 該代理將徹底改變開啟應用程式的方式。
在這些變化到來之前,比起代理本身的影響,如何構建代理是更值得關注的。
在代理搭建平台上,企業或許可以搭建自己的RPA、CRM、辦公OA等一系列管理軟體軟體廠商也可以基於此平台構建軟體,為企業提供服務。
對於正在或即將進入AI代理領域的玩家找到切入點和良好的商業模式至關重要。
未來,AI智慧型體的發展將不僅僅侷限於單一的智慧型,還將延伸到物智慧型與機械人的聯動。
從群體智慧型的角度來看,TOC可以形成乙個更大的基於社群的虛擬組織,其中每個人的代理都可以通過虛擬資料連線在一起另一方面,TOB可以形成虛擬組織和企業,不同的企業和員工可以通過代理融入網路。
最終整個社會將成為乙個虛實結合的巨大網路,形成乙個“智慧型網路”。 在這個網路中,不同的主體將提供更高的生產力,重塑整個生產關係,從而提高整個社會的生產力。
因此,人工智慧智慧型體的發展前景非常廣闊,它們將不斷擴大其應用範圍和影響力,為未來的社會發展帶來巨大的變化和機遇。
時至今日,雖然AI Agent帶來了很多想象空間,但仍存在很多疑問。 技術發展的道路充滿了質疑和批評,技術變革對任何企業和個人來說都是乙個機遇,關鍵是如何把握。