《紐約時報》去年 12 月起訴 OpenAI 和 Microsoft Corp.,指控這兩家公司非法使用其受版權保護的材料來訓練 AI 模型。 直到今天,OpenAI公開回擊並發表了一篇部落格文章,稱“我們支援新聞業,與新聞機構合作,並認為《紐約時報》的訴訟是毫無根據的。 ”
在部落格文章中,該公司重申了以下四個立場:
我們與新聞機構合作,創造新的機會。
培訓是合理使用的,但我們提供了選擇退出的機會,因為這是正確的做法。
“反流”是乙個罕見的錯誤,我們正在努力將其減少到零。
《紐約時報》並沒有講述完整的故事。
OpenAI表示,其目標是支援乙個健康的新聞生態系統,成為乙個良好的合作夥伴,並創造互惠互利的機會考慮到這一點,該公司一直在尋求與新聞機構建立合作夥伴關係。 通過與美聯社、阿克塞爾·斯普林格(Axel Springer)、美國新聞專案(American Journalism Project)和紐約大學(New York University)的早期合作,他們已經對這種方法有了初步的了解。
該公司認為,一些被普遍接受的先例表明,使用公開的網際網絡材料訓練人工智慧模型屬於合理使用範疇。 “我們相信這一原則對創造者是公平的,對創新者是必要的,對美國的競爭力至關重要。 ”
至於“反芻”,OpenAI解釋說,他們已經採取措施限制無意的記憶,並防止大型模型輸出中的反芻。 還需要注意的是,如果訓練資料來自單個**(例如,《紐約時報》),則反芻的可能性較小;還敦促使用者:"act responsibly"以避免故意促使他們的模型反芻。 “故意操縱我們的反芻模型不是對我們技術的適當使用,違反了我們的使用條款”。 “反芻”是指特定內容在大型模型的訓練資料中多次出現的現象。
OpenAI 透露,與《紐約時報》的最後一次溝通是在 2023 年 12 月 19 日,“我們與《紐約時報》的討論似乎取得了建設性進展”。 我們向《紐約時報》解釋說,與任何單一的**一樣,它們的內容對我們現有模型的訓練沒有有意義的貢獻,也不會對未來的訓練產生足夠的影響。 但他們在12月27日提起訴訟——我們通過《紐約時報》了解到這一點——令我們感到驚訝和失望。 ”
值得一提的是,OpenAI表示,《紐約時報》在雙方的溝通過程中發現了一些反芻,但在OpenAI致力於調查和解決任何問題的前提下,一再拒絕分享任何例子。
有趣的是,《紐約時報》提到的反思似乎來自多年前在多個第三方**上大量流傳的文章。 為了讓我們的模型反芻,他們似乎故意篡改了提示,通常包括文章的冗長摘錄。 即使使用這樣的提示,我們的模型也經常不會像《紐約時報》暗示的那樣做,這表明他們要麼在指示模型反芻,要麼從無數次嘗試中精心挑選了一些例子。在宣告的最後,OpenAI表示,儘管他們認為《紐約時報》的訴訟毫無根據;但人們仍然尊重《紐約時報》,並希望與它建立建設性的夥伴關係。 “我們期待繼續與新聞機構合作,通過實現人工智慧的變革潛力,幫助他們提高製作高質量新聞的能力。 ”儘管他們聲稱這種濫用不是典型或允許的使用者行為,也不能替代《紐約時報》。 但無論如何,我們一直在不斷提高系統對反向攻擊的抵抗力,以避免對訓練資料的反芻,我們在最近的模型中取得了很大的進步。
OpenAI的回應正值關於生成式AI的版權辯論公升溫之際。 一些資料表明,公眾更傾向於站在出版商一邊。 根據《紐約時報》對OpenAI提起訴訟的細節,根據《紐約時報》對OpenAI提起訴訟的細節,59%的受訪者同意不應允許AI公司使用出版商的內容來訓練模型70%的受訪者表示,如果他們想在模型訓練中使用受版權保護的材料,他們應該向出版商提供補償。