隨著 ChatGPT 等新興 AI 模型的興起,它們所依賴的網路爬蟲正面臨著來自全球主流新聞的大規模封鎖**。 理察·弗萊徹博士的團隊發現,截至 2023 年底,48% 的 ** 遮蔽了 OpenAI 的爬蟲,24% 遮蔽了谷歌的爬蟲。 那麼有多少新聞**遮蔽了AI爬蟲呢?
1. AI網路爬蟲
網路爬蟲,有時稱為“蜘蛛”或“機械人”,會自動瀏覽網路以系統地收集資料。 搜尋引擎依靠其網路爬蟲收集的資料來索引網路上的頁面,以便快速響應搜尋查詢。
OpenAI 等 AI 公司可以使用爬蟲從網路收集資料來訓練他們的模型。 大型語言模型 (LLMS) 需要在大量資料上進行訓練才能有效,而 Web 對於高質量的文字和視聽資料非常重要**。
訓練完成後,像 GPT 這樣的 LLMS 可以通過 ChatGPT 等生成、輸出和回答使用者的問題。 雖然這些模型不需要網際網絡連線即可執行,但經過訓練後,它們還可以連線到網路以實時檢索資訊,然後作為輸出的一部分。
然而,由於各種可能的原因,News**可能不希望他們的內容被人工智慧公司使用。
第二後續調查差異很大
為了了解各國主流新聞**對AI爬蟲的遮蔽政策,Richard Fletcher博士的團隊發起了一項後續調查。 追蹤2023年10個國家前15大主流新聞**的爬蟲遮蔽政策統計,通過定期抓取重大新聞**的機械人TXT檔案,他們監測了不同國家和不同時間節點的爬蟲比例,新聞**遮蔽了OpenAI和Google等公司,並公布了調查結果。
1.遮蔽比差異很大。
不同國家主流新聞**對AI爬蟲的態度存在顯著差異。 就 OpenAI 而言,美國高達 79% 的新聞**被遮蔽,而墨西哥和波蘭只有約 20%。 谷歌爬蟲之間也有類似的差異,德國有 60% 被遮蔽,波蘭和西班牙只有 7%。
2.遮蔽時間點差異很大。
在大多數國家/地區,一些新聞**會在 AI 爬蟲推出後不久採取行動阻止它們; 在西班牙、墨西哥和波蘭等國家,主流**措施似乎更加緩慢和保守。 這可能與不同國家對人工智慧的態度差異有關。
3.谷歌受到了雙重打擊。
97% 的人遮蔽了 Google 爬蟲**,也遮蔽了 OpenAI。 雖然兩者是不同的系統,但新聞並沒有區分它們。 這預示著谷歌將面臨比新聞人工智慧領域競爭對手更多的限制。
不難看出,全球主流**對第三方AI平台的警惕性正在上公升。 這將對人工智慧相關模型的訓練和應用產生負面影響。
第三主流**比較保守
調查結果還反映出,主流**在人工智慧政策上普遍更加謹慎和保守。
具體來說,相較於網路使用者群體小的垂直**,流行的口碑**更傾向於設定AI爬蟲遮蔽。 同樣,與電視台和數字平台相比,具有深厚印刷傳統的報紙和雜誌更有可能在其線上版塊中阻止人工智慧爬蟲。
這種心理保守的態度與多種考慮有關:
一是主流**的內容價值更高,更重視智財權,不希望AI平台免費獲得利益;
其次,公眾**更擔心錯誤資訊誤導公眾,損害公眾的公信力;
第三,傳統從業者對人工智慧的了解不多,更難以理解長期利益的平衡。
所有的新聞**和封鎖後的每一天,AI爬蟲都沒有解封的跡象。 這表明媒體對人工智慧公司趨於保守,除非達成新的利益平衡,例如許可使用商業合作模式,否則主流**不太可能在短期內取消限制,因為內容價值、資訊保安和其他考慮因素。
結論:
不難看出,本次調查結果顯示,到2023年底,全球主流新聞**對於第三方AI平台的資訊採集,基本會持防禦態度。 隨著人工智慧公司與媒體之間的利益博弈仍在繼續,未來雙方關係將何去何從?
參考資料**網路,如有任何疑問,請聯絡刪除。