人工智慧代理的任務是讓我們每天最多工作四個小時

Mondo 健康 更新 2024-02-21

2024年,這座城市將到處都是人工智慧代理。 上個月,他說他正在做AI Copilot,但這個月他說他是一名特工。 人工智慧黑客馬拉松現在很流行,一場比賽後至少可以看到幾十個所謂的“人工智慧代理”。

在大型語言模型爆炸的那一年,我們一直處於“概念陷阱”中,用嘴跑火車,談論各種新術語:代理、副駕駛、rag、推理、接地、對齊、......說實話,我有點惱火,如果我沒有這些話掛在嘴邊,難道我不配從事人工智慧嗎? 更重要的是,當人們討論乙個術語時,他們是否在談論同一件事?

例如,“AI Agent”:你做了乙個自動寫入小紅書文案的 GPTS,說這是乙個寫入代理; 我做了乙個基於大型語言模型的RPG遊戲角色模擬器,並說這是乙個遊戲開發代理......這時候,有人說:這些都是AI輔助工具,充其量是Copilot(copilot),你看看史丹福大學和谷歌的“斯坦福城”,25個AI相互交流協作,這才是真正的AI代理。 誰是對的? 什麼是 AI 代理? 這其實就是我們目前的情況:人們在討論乙個AI概念時,缺乏乙個共同的定義作為前提,認知上從來就沒有“對齊”。

很多人把“AI智慧型體”當成乙個大語言模型時代的新名詞來討論,卻不知道“智慧型體”是乙個硬核的人工智慧概念。 我聯絡了一會兒,“代理”第一次作為人工智慧術語出現是在 1995 年出版的經典人工智慧教科書《人工智慧:一種現代方法》中。 該書將人工智慧定義為:“智慧型代理的研究和設計”。 這看,“智慧型體”至少在近30年前就被視為人工智慧發展的終極目標。 發展人工智慧是人類的初衷,即找到人類所有行為的“**人”。

許多人還忽略了這樣乙個事實,即“代理人”在經濟學和組織行為學中也是乙個眾所周知的概念。 現代經濟社會充斥著各式各樣的“代理”,如大家熟悉的公關公司、旅行社等,其含義是代理代表一方行事和交易。 人工智慧定義的“代理”的含義接近經濟學和組織行為學——即人工智慧作為乙個人或乙個組織的代表,進行特定的行為和交易,降低個人或組織工作的複雜性,減少工作量和溝通成本。

人工智慧真的有能力成為“智慧型體”,依靠大型語言模型。 人工智慧代理這個古老的概念在 2023 年變得流行,這絕非巧合。 OpenAI 安全團隊負責人 Lilian Weng 撰寫了著名的“LLM Powered Autonomous Agents”,這被廣泛認為是 OpenAI 對“AI Agent”的官方定義。 本文將智慧型體定義為一組大語言模型(LLM)、記憶、任務規劃(規劃技能)和工具使用,其中LLM是核心大腦,記憶、任務規劃和工具使用是智慧型體的三大核心組成部分。 值得注意的是,**智慧型體自主使用工具呼叫外部API,自主分解任務的子目標,自主建立思維鏈(COT),具有自我批評和自我反饋的能力它們都指向文章標題中的關鍵字“自主”,即代理自動化。

人工智慧革命被廣泛稱為“第四次工業革命”,前三次分別是19世紀初的蒸汽機革命、19世紀末的電力革命和20世紀中葉的資訊科技革命。 貫穿前三次工業革命的關鍵詞是“自動化”。 蒸汽機和電力革命使工業生產周圍的體力勞動自動化,提高了生產效率。 資訊科技革命在進一步提高工業生產自動化程度的同時,也可以取代人類的一些腦力勞動。 如第四次工業革命的人工智慧革命,一方面使工業生產的自動化更加徹底(如充滿機械人和感測器的無人工廠),另一方面,它空前地開啟了腦力勞動的自動化過程。 腦力勞動自動化的載體是AI代理。

從這個意義上說,關於什麼是人工智慧代理的爭論有些無聊。 《斯坦福鎮》基於乙個開創性的實驗,以此為坐標來判斷乙個AI應用是否是“智慧型體”,這並不能幫助AI智慧型體提高智慧型密集型工作的效率。 我的下乙個重要論點是:AI Agent本質上是“人類行動的自動化”。 只要不是在人類的手動要求下完成任務,就像在ChatGPT對話方塊中輸入提示,啟動Office 365的“copilot”來完成每一項具體的工作,但又有一定的自主性甚至不完全可控性來完成任務,它就是AI代理。

現在比較尷尬的乙個情況是:你可能已經看過不少於20條關於AI Agent的推文,你從來沒有真正用過乙個好的Agent,這大概是Agent作為乙個新物種注定要經歷的階段。 長期以來,人們經常提到AI代理模型是具有GPT能力的AutoGPT。 然而,現在,美國和中國都有一些更好的人工智慧代理的原型。 您可以藉此機會安利...

首先是ChatGPT新推出的公升級付費版——ChatGPT團隊。 它為擁有個人ChatGPT賬號的小企業內部的協作提供了乙個“私域空間”,ChatGPT團隊的使用者資料不會用於對GPT模型進行反向訓練,使用者還可以在企業內部建立GPTS,讓這些GPT協同工作。 老實說,我認為 ChatGPT 團隊比 GPT Store 更重要、更有用。 現在的 GPT Store 太亂了,大多數 GPTS 都很粗糙,對話方塊告訴你它為你做了什麼,你根本無法呼叫 API。 然而,隨著ChatGPT團隊在私有環境中的使用,GPT們可以更順暢地呼叫彼此的介面,相互協作更加順暢。 ChatGPT團隊是全球最大的AI平台ChatGPT,邁向AI代理的第一步(畢竟ChatGPT已經擁有15萬企業客戶)。

第二個是智普AI的GLM模型代理(GLMS)。 清華的色彩鮮豔的智浦AI是國內最像OpenAI的公司,剛剛推出的GLM-4完全對GPT-4進行對標,在多項評測基準中達到了GPT-4的85%以上。 GLMS 是 GLM-4 的副產品,也是 GLM-4 模型功能的溢位。 GLM-4 的“所有工具”允許 GLM-4 根據使用者的需求決定是否繪製、搜尋、製作或程式設計問題——這本質上是乙個 AI 代理。 與只追求通用性的Open AI不同,智普AI擁有一系列針對金融、醫療、教育等垂直行業的定製化部署服務,積累了一定的客戶群和行業知識,這使得智普客戶基於GLM-4部署GLMS代理更加合理、更容易。

三是“面牆智慧型”,也屬於清華大學的背景: Facewall Intelligence 有自己的“Stanford Town”,它基於 Facewall Intelligence 的 ChatDev 框架。 但“小鎮”不是乙個虛擬社會,而是乙個軟體公司的AI版本。 不同的 AI 代理被設計為程式設計師、產品經理、測試工程師和設計師,他們可以相互協作並自力更生——就像每天在辦公室裡發生的事情一樣。 Facewall Intelligence 的 ChatGPTdev 框架支援開發者構建自己的 AI Agent,結合單一智慧型和群組智慧型,讓 AI Agent 成為每個員工都可以使用的辦公自動化工具,可以“逃避”很多狗屎工作。 順便說一句,ChatDev 框架的形成不遲於“斯坦福鎮”的發布。對此最大的影響之一是原生 AI 應用程式開發的可能性——AI Agent 自動化了 AI 應用程式開發。

第。

第四和第五分別是釘釘和飛書的“代理”實踐。 如果我們認為AI Agent是乙個生產力工具,我們不能忽視釘釘和飛書上已經存在的億萬使用者,數百萬的政企組織,海量文件、會議紀要、溝通記錄、多維度**和自建工具——這些工具讓釘釘的“智慧型助手”和飛書的“智慧型夥伴”更容易化身到每乙個使用它們的農民工的嘴裡和大腦裡, 並且可以部分自主地完成一些事務性的狗屎工作,比如工作總結、會議紀要、報銷和差旅流程、對一件事的後續反饋,甚至可能幫助人們扯掉和撕掉 X。 作為釘釘和飛書的雙重使用者,我必須說:現在的釘釘智慧型助手和飛書智慧型夥伴還遠未“好用”——這大概就是通益模式和雲雀模式的鍋了。 不過,在場景豐富、資料真實、使用者數量等方面,釘釘的“智慧型助手”和飛書的“智慧型夥伴”更容易真正“使用”。 座席也對被使用有更好的了解。 一旦模式進展,釘釘和飛書的代理化將向前邁出一大步。 我再說乙個激烈的論點——釘釘、飛書將成為AI代理在中國的重要產品。

在“簡單”和“有趣”之間。我堅信,對於 AI Agent 來說,“易於使用”比“有趣”更重要。 它首先是一種生產力工具。 那些AI陪伴的紙上男女朋友,也有理解力和情感價值,但可以稱得上是“特工”或“智慧型娃娃”,但並不“聰明”,因為他們不具備人類完成任務或任務的能力。 所以把AI Agent翻譯成“agent”是不合適的,而是“intelligence**”。“*是AI Agent的經濟和組織行為屬性,也是其腦力勞動自動化能力的本質。

在剛剛結束的CES上,史丹福大學著名人工智慧學者李飛飛提出了乙個重要的觀點:應該明確的是,AI代理取代了人類的“任務”而不是“工作”。 在達沃斯論壇上,OpenAI首席執行官薩姆·奧特曼(Sam Altman)在面對“人工智慧使人失業”的老盤問時,表達了更直接的觀點:“人工智慧取代了人們的工作方式,而不是工作本身。

我非常同意李飛飛和山姆·奧特曼兩位老師的觀點,即腦力工作者的工作是由特定的關鍵任務組成的,但這不是工作的全部。 目標設定、創造力、資源獲取和分配、設定更高的目標、組織不同的任務、判斷力、說服力和表現力、......我們的工作中還有很多更有意義的元素。 把流程的“任務”,事務和日常操作的工作留給代理,寫幾行例行公事**,發幾封戰郵件,少做機械操作**,調整ppt格式幾次,少複製貼上,親自發起和批准一些例行的出差和報銷流程,我們的工作應該更快樂,更有創意。

當然,AI代理的普及可能會讓一些“白領”吃虧甚至丟掉工作,但它會大大提高聰明人的創造力、模式感、整體感和生產力,在很多崗位上——甚至在基層,提高工作效率,創造更多的生產力, 更重要的是,減少工作時間。

大約100年前,“八小時工作日”成為全世界的普遍標準。 人們每天只能工作八小時,這是自電力工業革命以來工人階級鬥爭和生產力爆炸式增長的結果。 面對更高的生產力,人們有信心爭取更少的工作時間、更高的工資和更多的學習、休閒和旅遊消費時間。 然而,自從計算機革命以來,人類的生產力空前提高,為什麼人們的工作時間沒有進一步減少,而是在一些智力最密集的技術和網際網絡公司中增加呢? 996呢? 這裡一定有什麼問題嗎?

讓我再提出乙個重要的論點:在未來,人工智慧代理將有多聰明,看看它是否允許我們每天只工作四個小時。 那些重複的、基於過程的、反思性的、經驗主義的、強化學習可以理解的,甚至是表演性的工作,都留給了AI Agent——它們可能是釘釘和飛書,可能是面向牆壁的智慧型研討會,也可能是GLM和GPT的企業版。 無論如何,“我只想要結果”,因為我真的只想每天工作四個小時。

前不久,我和釘釘總裁葉軍聊了聊,覺得釘釘有一種“改主意做新人”的緊迫感,特別想從“小學生天敵”和“壓員工神器”的口碑中選擇自己。 於是他們做了乙個釘釘智慧型助手。 我問,這東西能讓我們每天只工作四個小時嗎? 他說:“如果可能的話,每天工作乙個小時。 事後,我覺得葉先生還是有點不高興的。 但是,他說AI Agent可以讓更多的人成為自己的老闆,我同意這一點。 經紀人幫助了你,你不會說自己傻。

相關問題答案

    誰讓我們這麼累?

    我從來沒有聽過一句話,中國人是最勤勞的民族!不知道有多少人被這句話騙了,也不知道還有多少人相信這句話!人們會變得惰性,會知道疲倦不是一件好事。但為什麼我們仍然在內卷化呢?是因為我們想不通嗎?還是有人讓我們想知道?這是乙個你不能說實話的時候。我們沒有權利喊累,因為只要你敢說你累了,就會有人告訴你,我們...

    歲月不生,四季流淌。 讓我們珍惜每一刻,不留遺憾

    讓我們用一月的美麗迎接二月的到來,用新的希望和夢想編織更加多彩的生活篇章。在這個過程中,我們會遇到困難和挑戰,但也會有收穫和快樂。只要我們保持積極的態度,勇敢面對生活中的每乙個挑戰,我們就能不斷前進和成長。歲月不生,四季流淌。讓我們珍惜每一刻,不留遺憾在新的一年裡,願我們都能擁有一顆感恩的心,感恩生...

    讓我們擺動雙槳,看看它在哪裡

    讓我們擺動雙槳是北海公園的景色。這首歌描繪了人們在湖上划船,欣賞美麗的自然風光,感受和諧 安寧和美妙的氛圍。北海公園位於北京市中心,是一座古老的中國皇家園林,也是北京著名的旅遊景點之一。園內有許多美麗的景點,如瓊華島 九龍牆 白塔等,還有許多美麗的湖泊和河流,其中最著名的是北海湖。北海湖是北海公園最...

    誰給了梅西這麼大的勇氣,讓我們給他一首很酷的歌

    梅西未能在香港踢球引起了球迷的不滿和爭議,他們暫時決定在中華之行期間不參加比賽,賽後也沒有繞著球場向球迷表示感謝或發表任何言論,甚至在頒獎典禮上雙手插兜冷漠地走開。這種對球迷的不尊重,讓人心疼不已。梅西對不上場的解釋是 沒有受傷,只是不舒服 這種回應讓人覺得他沒有足夠關注香港明星隊。而有訊息稱梅西將...

    讓我們接受孩子的平庸

    有個同事住在學區裡,更重要的是有錢人家,也就是家裡有礦山的幸福家庭,從來不會有缺錢的煩惱。有乙個女兒,從小一直沉浸在名校裡長大。我笑著問同事女兒的成績好不好,考了名校的重點班。同事看了我一眼,隨口說 你為什麼一定要去重點班?孩子的成績不夠好,上學習很辛苦,我們還把孩子推到重點班,難道不把孩子推到火坑...