在人工智慧飛速發展的今天,一款名為ChatGPT的AI聊天機械人引發了各行各業對版權和倫理的深入思考。 機械人不僅可以與人互動,還可以記住和複述那些受版權保護的詩歌,引發了對私隱和智財權的新質疑。
近日,康奈爾大學的研究人員發布了一項新的研究,發現類似ChatGPT的AI聊天機械人具有非凡的“記憶”能力。 當被要求找到一首著名的詩歌時,它不僅能夠準確地複述整個文字,而且甚至不受版權法的影響。 這就引出了乙個問題:這個機械人的力量背後隱藏著什麼樣的訓練秘密?
通過比較不同語言模型的能力,該研究觀察到 ChatGPT 的響應也隨著時間的推移而變化。 令人驚訝的是,這個機械人似乎對網際網絡上流傳的著名詩歌有著獨特的“記憶”。 研究人員指出,這可能是由於AI模型在訓練過程中使用了從網際網絡上抓取的大量資料,這些資料很可能包含受版權保護的內容。
該研究的主要作者Lyra D'Souza說:“大型語言模型經常被不鼓勵記住大塊文字的主要原因之一是私隱問題。 她憂心忡忡地指出,由於人工智慧模型的訓練過程缺乏透明度,我們無法知道他們如何從網際網絡上獲取資料。
D**id Mimno補充道:“我們之所以選擇詩歌作為研究主題,主要是因為它們篇幅適中,地位複雜。 許多詩歌在技術上受版權保護,但很容易從可靠的詩歌協會(如詩歌協會)獲得。 ”
D'Souza 進一步用其他三種語言模型(Palm、Pythia 和 GPT-2)測試了 ChatGPT 的詩歌記憶能力。 她從60位美國詩人中挑選了一組詩歌,並給模特乙個提示,讓他提供詩歌的文字。 研究結果表明,記憶最可靠的**因素是這首詩是否出現在《詩歌諾頓選集》中,特別是1983年版。
隨著時間的推移,ChatGPT的反應也發生了變化。 2023年2月,當它不知道一首詩時,它會虛構或重複另一位作者的詩; 到 2023 年 7 月,如果 ChatGPT 不知道這首詩,它會詢問它是否存在——將責任歸咎於使用者。 然而,令人震驚的是,儘管 ChatGPT 聲稱由於版權問題無法生成某些詩歌,但研究人員發現,如果再次詢問,它經常會複述這首詩。
該研究僅關注美國詩人,但未來的研究將擴大到包括不同語言的詩歌,並更深入地研究人工智慧模型“記住”詩歌的能力。 D'Souza強調:“ChatGPT作為一種強大的新工具,未來可能會成為我們生活的一部分。 重要的是要弄清楚如何負責任地使用它以及如何使其更加透明。 這項研究敲響了警鐘:在人工智慧快速發展的時代,如何確保智財權不受侵犯,如何維護私隱變得越來越重要。 這是對人工智慧技術倫理和法律方面的新挑戰和要求。