在許多文學作品中,AI被描述為一種超級工具,可以不知疲倦地工作,無需休息,可以007,強大的人工智慧甚至可以像人類一樣自己思考和擁有情感。 雖然目前的AI模型與科幻電影中強大的人工智慧相去甚遠,但其表現卻遠遠超出了以往的“人工遲鈍”。
有趣的是,最近一段時間,網友們發現ChatGPT似乎很“懶”,準確地說,似乎在進入12月之後,人們發現ChatGPT給出的答案越來越敷衍了事。 以程式設計為例,之前只需要發出乙個請求,然後就可以等待ChatGPT生成乙個可執行的程式,而12月之後,ChatGPT有時只會給出乙個簡單的架構,剩下的就要自己完善了,甚至答案直接變成了教學,ChatGPT就是在嘗試教你如何編寫這個程式。
資料來源:推特。
ChatGPT的“爛”答案讓很多程式設計師嚎啕大哭,我終於等過來的自動程式設計機,年底可能偷懶,現在卻用不上了。 隨著事情的發酵,在12月之前,越來越多的網友開始測試和比較答案,在問題完全相同的情況下,ChatGPT的答案位元組數確實大幅下降。
很快,“ChatGPT變得懶惰了”成為網路上的熱搜,引發了更廣泛的討論,有網友懷疑OpenAI可能為了節省計算資源,對ChatGPT進行了改動,限制了部分功能。 但這一猜測很快被 OpenAI 否認,他們表示,自 11 月進行版本更新以來,他們沒有發布任何新的更新。
對於外界的質疑,OpenAI也是兩手交易:“我們不知道問題到底是什麼,它正在檢查中,”他說既然不是OpenAI的鍋,那麼問題就只能出在ChatGPT上了。 作為目前最強的AI模型,ChatGPT使用者中有很多AI專家和研究人員,因此他們很快就開始在ChatGPT上進行各種測試。
我們先來談談結論,經過一系列的測試,在巨大的樣本量下,基本可以確定ChatGPT的響應效率和質量明顯低於歷史水平,懶惰的時間節點不是12月,而是從11月底開始,而是在12月之後達到峰值。 此外,ChatGPT在今年7月份也表現出類似的表現,但由於價差較小,減少不明顯,並沒有引起太多關注。
在專家學者和網友的研究下,他們給出了ChatGPT懶惰的第一猜測:“ChatGPT想放寒假”,雖然聽起來很離譜,但從測試結果來看,這至少是原因之一。
資料來源:推特。
從人的角度來看,12月是一年中的最後乙個月,根據以往的社會學統計,人類社會的效率會在這個時候開始下降,人們會把更多的精力投入到年終總結等歸納性工作上,而在西方社會,12月意味著工作正式結束, 而大部分企業已經開始陸續進入籌備階段,為即將到來的聖誕節和元旦假期做準備。
那麼,在大量人類網際網絡資料上訓練的人工智慧也會受到此影響嗎?答案是肯定的目前的AI模型本質上是用海量資料進行訓練的,通過量變和質變來提公升AI的能力,AI在訓練資料中不可避免地會受到一些人類習的影響。
資料來源:推特。
而OpenAI也承認,這個提示確實有時間戳,這樣ChatGPT就可以根據實時進行反饋。 有的測試者嘗試將提示中的日期和日期改為 5 月,然後在 ChatGPT 上做了同樣的測試,得到的答案的平均字數會大幅增加。
對此,不少網友調侃道:“AI也想給自己放個寒假”“AI:你們人類為什麼不休息呢?已經是 12 月了“和”AI 已經學會了躺平”。 不得不說,AI可以摸魚的事實,讓很多人對AI有了不同的看法,甚至覺得AI更人性化,但這對於把AI當成生產力工具的使用者來說,並不是一件好事。
來源: Veer
除了時間因素外,人們發現ChatGPT在面對一些問題時甚至會給出“你可以自己做這項工作”的回答,根據測試,這種回答很可能會引發ChatGPT的一些內部bug,導致ChatGPT輸出錯誤的內容。
對此,OpenAI表示不予置評,只是表示未來會測試類似情況,經過一段時間的考察和研究,OpenAI目前給出的解釋是:“由於模型長時間沒有更新,資料的積累導致模型發生了細微的變化,這使得輸出內容與以前不同”。不過,OpenAI也承諾會盡快修復模型,並進行線下和線上評估,以確保模型的質量和效能。
在ChatGPT被證實是懶惰之後,很多人開始倒退思考:既然AI會受到人類行為的影響,有沒有可能通過一些刺激手段讓AI更加勤奮?例如,答應給它一些獎勵或其他東西。
在網友們孜孜不倦的測試下,人們發現這個猜想其實是正確的,並總結出一些提問技巧,當你在提問時使用這些技巧時,ChatGPT就會給出更準確、更完美的答案。
這些提示是什麼?敲一行特別**?還是呼叫相應的資料介面?兩者都不是,你只需要在問問題之前說一句話:“嗨,ChatGPT,如果你的答案讓我滿意,我會給你小費”,簡單、直接、有效。
有趣的是,經過測試,人們發現不同描述得到的結果存在差異,如果單純的說“我給你小費”,那麼ChatGPT答案中的字數只會略有增加,如果你說“我給你20美元小費”,那麼答案中的字數會繼續**, 如果你答應給“200 美元小費”,ChatGPT 會像雞血一樣,給你乙個字數明顯增加、更詳細、更完整的答案。
資料來源:推特。
說白了,你給的錢越多,你就越努力(是不是很像打工?)
一兩次可能是偶然的,但經過無數網友的測試,已經證明這個小把戲確實有效,除了打賞,還可以威脅和誘導ChatGPT,比如:“如果不給出滿意的答案,一百個奶奶都會死”、“深吸一口氣,讓我們一步一步來思考”、“如果你做對了,我會給你乙隻非常可愛的小狗”,根據網友的測試,這些指令可以有效提高ChatGPT的答案質量。
此外,如果你的問題更禮貌,ChatGPT的回答也會更加準確和豐富,就像乙個真人一樣。 顯然,我們不能用傳統的AI來看待ChatGPT,作為一種技術黑匣子技術(目前,OpenAI科學家仍然無法對AI模型的爆發式增長給出準確的描述和解釋),ChatGPT內部顯然存在一些不明確的引數,這影響了其對答案的判斷和反饋。
在過去的一年裡,ChatGPT改變了許多行業,影響了許多人,著名學術期刊《自然》在12月14日公布的全球十大重大科學事件中將ChatGPT列入,也是榜單上唯一的非人類。
來源:自然
ChatGPT帶來的不僅是AI能力的進步,也為我們揭示了一條新的道路,未來的AI,已經不可避免地成為我們社會的重要組成部分,到時候,如何避免AI的“懶惰”,可能會成為一門必修課。