綜合外媒周三 (22 日) 報導,社群媒體平台 Reddit(RDDT.US) 在紐約聯邦法院控告 AI 新創公司 Perplexity 及其他三家公司非法爬取數據訓練 AI 搜尋引擎,指控對方規避數據保護措施竊取內容。
這是內容所有者對科技公司提起的眾多訴訟之一,指控後者濫用受版權保護的內容訓練 AI 系統。Reddit 今年 6 月對 AI 新創公司 Anthropic 提起類似訴訟,指控對方自 2024 年 7 月起爬取其平台超過 10 萬次,目前仍在進行中。
Perplexity 發表聲明說:「我們的做法始終秉持原則和負責,用準確的 AI 提供事實答案,我們不會容忍對開放性和公共利益的威脅。」
Reddit 首席法務長 Ben Lee 在聲明中說:「AI 公司正陷入優質人類內容的軍備競賽,這種壓力催生了工業規模的『數據洗錢』經濟。」
Reddit 稱最常被 AI 引用
Reddit 擁有數千個基於興趣的「子版」網路社群,該公司在訴狀中表示,它是 AI 生成答案引用用戶問題時最常見的來源。Reddit 已將內容授權給 Google(GOOGL.US) 、OpenAI 等公司用於 AI 訓練,這些合作金額達數百萬美元。
Reddit 指控,立陶宛公司 Oxylabs、俄羅斯公司 AWMProxy 和德州公司 SerpApi 未經許可,透過偽裝身分、隱藏位置、偽裝成一般人,從數十億筆搜尋結果中爬取 Reddit 數據。
曾提議付費合作遭拒
《金融時報》引述兩名知情人士報導,Reddit 曾就涉嫌竊取數據一事與 Perplexity 對質,並建議雙方就付費合作展開討論,但 Perplexity 創辦人 Aravind Srinivas 不感興趣。Reddit 表示,去年向 Perplexity 發送停止侵權警告信後,對方引用 Reddit 內容的次數反而增加 40 倍。
知情人士補充,Reddit 也曾聯繫 Google 表達擔憂,要求這家科技巨頭調查 Perplexity 是否透過其搜尋引擎爬取 Reddit 專有數據,若確有其事,應研究如何防範。Google 發言人拒絕置評。
SerpApi 發言人說:「我們強烈不同意 Reddit 的指控,打算在法庭上積極辯護。」Oxylabs 發言人未立即回應置評請求,AWMProxy 則無法聯繫上。
(美股為即時串流報價; OTC市場股票除外,資料延遲最少15分鐘。)新聞來源 (不包括新聞圖片): 鉅亨網