人工智慧代理的任務是讓我們每天最多工作四個小時

2024年，這座城市將到處都是人工智慧代理。上個月，他說他正在做AI Copilot，但這個月他說他是一名特工。人工智慧黑客馬拉松現在很流行，一場比賽後至少可以看到幾十個所謂的“人工智慧代理”。

在大型語言模型爆炸的那一年，我們一直處於“概念陷阱”中，用嘴跑火車，談論各種新術語：代理、副駕駛、rag、推理、接地、對齊、......說實話，我有點惱火，如果我沒有這些話掛在嘴邊，難道我不配從事人工智慧嗎？更重要的是，當人們討論乙個術語時，他們是否在談論同一件事？

例如，“AI Agent”：你做了乙個自動寫入小紅書文案的 GPTS，說這是乙個寫入代理; 我做了乙個基於大型語言模型的RPG遊戲角色模擬器，並說這是乙個遊戲開發代理......這時候，有人說：這些都是AI輔助工具，充其量是Copilot（copilot），你看看史丹福大學和谷歌的“斯坦福城”，25個AI相互交流協作，這才是真正的AI代理。誰是對的？什麼是 AI 代理？這其實就是我們目前的情況：人們在討論乙個AI概念時，缺乏乙個共同的定義作為前提，認知上從來就沒有“對齊”。

很多人把“AI智慧型體”當成乙個大語言模型時代的新名詞來討論，卻不知道“智慧型體”是乙個硬核的人工智慧概念。我聯絡了一會兒，“代理”第一次作為人工智慧術語出現是在 1995 年出版的經典人工智慧教科書《人工智慧：一種現代方法》中。該書將人工智慧定義為：“智慧型代理的研究和設計”。這看，“智慧型體”至少在近30年前就被視為人工智慧發展的終極目標。發展人工智慧是人類的初衷，即找到人類所有行為的“**人”。

許多人還忽略了這樣乙個事實，即“代理人”在經濟學和組織行為學中也是乙個眾所周知的概念。現代經濟社會充斥著各式各樣的“代理”，如大家熟悉的公關公司、旅行社等，其含義是代理代表一方行事和交易。人工智慧定義的“代理”的含義接近經濟學和組織行為學——即人工智慧作為乙個人或乙個組織的代表，進行特定的行為和交易，降低個人或組織工作的複雜性，減少工作量和溝通成本。

人工智慧真的有能力成為“智慧型體”，依靠大型語言模型。人工智慧代理這個古老的概念在 2023 年變得流行，這絕非巧合。 OpenAI 安全團隊負責人 Lilian Weng 撰寫了著名的“LLM Powered Autonomous Agents”，這被廣泛認為是 OpenAI 對“AI Agent”的官方定義。本文將智慧型體定義為一組大語言模型（LLM）、記憶、任務規劃（規劃技能）和工具使用，其中LLM是核心大腦，記憶、任務規劃和工具使用是智慧型體的三大核心組成部分。值得注意的是，**智慧型體自主使用工具呼叫外部API，自主分解任務的子目標，自主建立思維鏈（COT），具有自我批評和自我反饋的能力它們都指向文章標題中的關鍵字“自主”，即代理自動化。

人工智慧革命被廣泛稱為“第四次工業革命”，前三次分別是19世紀初的蒸汽機革命、19世紀末的電力革命和20世紀中葉的資訊科技革命。貫穿前三次工業革命的關鍵詞是“自動化”。蒸汽機和電力革命使工業生產周圍的體力勞動自動化，提高了生產效率。資訊科技革命在進一步提高工業生產自動化程度的同時，也可以取代人類的一些腦力勞動。如第四次工業革命的人工智慧革命，一方面使工業生產的自動化更加徹底（如充滿機械人和感測器的無人工廠），另一方面，它空前地開啟了腦力勞動的自動化過程。腦力勞動自動化的載體是AI代理。

從這個意義上說，關於什麼是人工智慧代理的爭論有些無聊。《斯坦福鎮》基於乙個開創性的實驗，以此為坐標來判斷乙個AI應用是否是“智慧型體”，這並不能幫助AI智慧型體提高智慧型密集型工作的效率。 我的下乙個重要論點是：AI Agent本質上是“人類行動的自動化”。 只要不是在人類的手動要求下完成任務，就像在ChatGPT對話方塊中輸入提示，啟動Office 365的“copilot”來完成每一項具體的工作，但又有一定的自主性甚至不完全可控性來完成任務，它就是AI代理。

現在比較尷尬的乙個情況是：你可能已經看過不少於20條關於AI Agent的推文，你從來沒有真正用過乙個好的Agent，這大概是Agent作為乙個新物種注定要經歷的階段。長期以來，人們經常提到AI代理模型是具有GPT能力的AutoGPT。然而，現在，美國和中國都有一些更好的人工智慧代理的原型。您可以藉此機會安利...

首先是ChatGPT新推出的公升級付費版——ChatGPT團隊。 它為擁有個人ChatGPT賬號的小企業內部的協作提供了乙個“私域空間”，ChatGPT團隊的使用者資料不會用於對GPT模型進行反向訓練，使用者還可以在企業內部建立GPTS，讓這些GPT協同工作。老實說，我認為 ChatGPT 團隊比 GPT Store 更重要、更有用。現在的 GPT Store 太亂了，大多數 GPTS 都很粗糙，對話方塊告訴你它為你做了什麼，你根本無法呼叫 API。然而，隨著ChatGPT團隊在私有環境中的使用，GPT們可以更順暢地呼叫彼此的介面，相互協作更加順暢。 ChatGPT團隊是全球最大的AI平台ChatGPT，邁向AI代理的第一步（畢竟ChatGPT已經擁有15萬企業客戶）。

第二個是智普AI的GLM模型代理（GLMS）。 清華的色彩鮮豔的智浦AI是國內最像OpenAI的公司，剛剛推出的GLM-4完全對GPT-4進行對標，在多項評測基準中達到了GPT-4的85%以上。 GLMS 是 GLM-4 的副產品，也是 GLM-4 模型功能的溢位。 GLM-4 的“所有工具”允許 GLM-4 根據使用者的需求決定是否繪製、搜尋、製作或程式設計問題——這本質上是乙個 AI 代理。與只追求通用性的Open AI不同，智普AI擁有一系列針對金融、醫療、教育等垂直行業的定製化部署服務，積累了一定的客戶群和行業知識，這使得智普客戶基於GLM-4部署GLMS代理更加合理、更容易。

三是“面牆智慧型”，也屬於清華大學的背景： Facewall Intelligence 有自己的“Stanford Town”，它基於 Facewall Intelligence 的 ChatDev 框架。但“小鎮”不是乙個虛擬社會，而是乙個軟體公司的AI版本。不同的 AI 代理被設計為程式設計師、產品經理、測試工程師和設計師，他們可以相互協作並自力更生——就像每天在辦公室裡發生的事情一樣。 Facewall Intelligence 的 ChatGPTdev 框架支援開發者構建自己的 AI Agent，結合單一智慧型和群組智慧型，讓 AI Agent 成為每個員工都可以使用的辦公自動化工具，可以“逃避”很多狗屎工作。順便說一句，ChatDev 框架的形成不遲於“斯坦福鎮”的發布。對此最大的影響之一是原生 AI 應用程式開發的可能性——AI Agent 自動化了 AI 應用程式開發。

第。

第四和第五分別是釘釘和飛書的“代理”實踐。如果我們認為AI Agent是乙個生產力工具，我們不能忽視釘釘和飛書上已經存在的億萬使用者，數百萬的政企組織，海量文件、會議紀要、溝通記錄、多維度**和自建工具——這些工具讓釘釘的“智慧型助手”和飛書的“智慧型夥伴”更容易化身到每乙個使用它們的農民工的嘴裡和大腦裡，並且可以部分自主地完成一些事務性的狗屎工作，比如工作總結、會議紀要、報銷和差旅流程、對一件事的後續反饋，甚至可能幫助人們扯掉和撕掉 X。作為釘釘和飛書的雙重使用者，我必須說：現在的釘釘智慧型助手和飛書智慧型夥伴還遠未“好用”——這大概就是通益模式和雲雀模式的鍋了。不過，在場景豐富、資料真實、使用者數量等方面，釘釘的“智慧型助手”和飛書的“智慧型夥伴”更容易真正“使用”。座席也對被使用有更好的了解。一旦模式進展，釘釘和飛書的代理化將向前邁出一大步。我再說乙個激烈的論點——釘釘、飛書將成為AI代理在中國的重要產品。

在“簡單”和“有趣”之間。我堅信，對於 AI Agent 來說，“易於使用”比“有趣”更重要。 它首先是一種生產力工具。那些AI陪伴的紙上男女朋友，也有理解力和情感價值，但可以稱得上是“特工”或“智慧型娃娃”，但並不“聰明”，因為他們不具備人類完成任務或任務的能力。 所以把AI Agent翻譯成“agent”是不合適的，而是“intelligence**”。“*是AI Agent的經濟和組織行為屬性，也是其腦力勞動自動化能力的本質。

在剛剛結束的CES上，史丹福大學著名人工智慧學者李飛飛提出了乙個重要的觀點：應該明確的是，AI代理取代了人類的“任務”而不是“工作”。在達沃斯論壇上，OpenAI首席執行官薩姆·奧特曼（Sam Altman）在面對“人工智慧使人失業”的老盤問時，表達了更直接的觀點：“人工智慧取代了人們的工作方式，而不是工作本身。

我非常同意李飛飛和山姆·奧特曼兩位老師的觀點，即腦力工作者的工作是由特定的關鍵任務組成的，但這不是工作的全部。目標設定、創造力、資源獲取和分配、設定更高的目標、組織不同的任務、判斷力、說服力和表現力、......我們的工作中還有很多更有意義的元素。把流程的“任務”，事務和日常操作的工作留給代理，寫幾行例行公事**，發幾封戰郵件，少做機械操作**，調整ppt格式幾次，少複製貼上，親自發起和批准一些例行的出差和報銷流程，我們的工作應該更快樂，更有創意。

當然，AI代理的普及可能會讓一些“白領”吃虧甚至丟掉工作，但它會大大提高聰明人的創造力、模式感、整體感和生產力，在很多崗位上——甚至在基層，提高工作效率，創造更多的生產力，更重要的是，減少工作時間。

大約100年前，“八小時工作日”成為全世界的普遍標準。人們每天只能工作八小時，這是自電力工業革命以來工人階級鬥爭和生產力爆炸式增長的結果。面對更高的生產力，人們有信心爭取更少的工作時間、更高的工資和更多的學習、休閒和旅遊消費時間。然而，自從計算機革命以來，人類的生產力空前提高，為什麼人們的工作時間沒有進一步減少，而是在一些智力最密集的技術和網際網絡公司中增加呢？ 996呢？這裡一定有什麼問題嗎？

讓我再提出乙個重要的論點：在未來，人工智慧代理將有多聰明，看看它是否允許我們每天只工作四個小時。那些重複的、基於過程的、反思性的、經驗主義的、強化學習可以理解的，甚至是表演性的工作，都留給了AI Agent——它們可能是釘釘和飛書，可能是面向牆壁的智慧型研討會，也可能是GLM和GPT的企業版。無論如何，“我只想要結果”，因為我真的只想每天工作四個小時。

前不久，我和釘釘總裁葉軍聊了聊，覺得釘釘有一種“改主意做新人”的緊迫感，特別想從“小學生天敵”和“壓員工神器”的口碑中選擇自己。於是他們做了乙個釘釘智慧型助手。我問，這東西能讓我們每天只工作四個小時嗎？他說：“如果可能的話，每天工作乙個小時。事後，我覺得葉先生還是有點不高興的。但是，他說AI Agent可以讓更多的人成為自己的老闆，我同意這一點。經紀人幫助了你，你不會說自己傻。

人工智慧代理的任務是讓我們每天最多工作四個小時

相關問題答案

誰讓我們這麼累？

歲月不生，四季流淌。讓我們珍惜每一刻，不留遺憾

讓我們擺動雙槳，看看它在哪裡

誰給了梅西這麼大的勇氣，讓我們給他一首很酷的歌

讓我們接受孩子的平庸

人工智慧代理的任務是讓我們每天最多工作四個小時

相關問題答案

誰讓我們這麼累？

歲月不生，四季流淌。 讓我們珍惜每一刻，不留遺憾

讓我們擺動雙槳，看看它在哪裡

誰給了梅西這麼大的勇氣，讓我們給他一首很酷的歌

讓我們接受孩子的平庸

歲月不生，四季流淌。讓我們珍惜每一刻，不留遺憾