OpenAI開撕紐約時(shí)報(bào)：故意引導(dǎo)ChatGPT得出抄襲結(jié)論

來源：量子位編輯：非小米時(shí)間：2024-01-10 11:54人閱讀

OpenAI的反擊來了。

針對(duì)被紐約時(shí)報(bào)提起史上最受關(guān)注的侵權(quán)訴訟一案，OpenAI公開發(fā)表長文表明立場(chǎng)。

文章直接表示：整個(gè)訴訟毫無根據(jù)，并指出紐約時(shí)報(bào)：

存在故意引導(dǎo)ChatGPT之嫌疑

隱瞞信息，沒有講出完整的事情經(jīng)過

以及OpenAI的總體觀點(diǎn)是：

（1）使用版權(quán)數(shù)據(jù)訓(xùn)練合理。沒有它們，哪來的當(dāng)今世界上最先進(jìn)的模型？（2）如果你不想被訓(xùn)練？可以退出。單一數(shù)據(jù)源（包括紐約時(shí)報(bào)在內(nèi)）的缺失也不會(huì)對(duì)模型的表現(xiàn)造成重要影響。

消息一出，吃瓜群眾再次火速聚集，吵成一團(tuán)。

支持OpenAI的直接“蝦仁豬心”：

紐約時(shí)報(bào)退出訓(xùn)練數(shù)據(jù)集，反而會(huì)讓模型輸出質(zhì)量更好（Doge）

有人則問了當(dāng)事模型GPT-4的看法，結(jié)果AI也把紐約時(shí)報(bào)無情嘲諷了一番：

吳恩達(dá)也洋洋灑灑寫了一大堆，總結(jié)來說就是：

同情OpenAI多于紐約時(shí)報(bào)，后者所說的全文抄襲更可能是RAG機(jī)制所致，并且實(shí)測(cè)OpenAI已經(jīng)堵住漏洞，質(zhì)疑紐約時(shí)報(bào)究竟受到了多少實(shí)際損失。

不過，反方網(wǎng)友也毫不留情，直接指著鼻子罵：

OpenAI，你太雙標(biāo)了，什么訓(xùn)練合理，都是為了你的利益最大化罷了。

你才是那個(gè)沒有講出完整故事的人。

OpenAI具體回應(yīng)

先來看看OpenAI回應(yīng)的具體立場(chǎng)，一共包含四個(gè)點(diǎn)：

1、非常樂意與新聞機(jī)構(gòu)合作

OpenAI表示，自己在技術(shù)設(shè)計(jì)過程中努力行動(dòng)支持新聞機(jī)構(gòu)，會(huì)見了數(shù)十家相關(guān)媒體，聆聽他們提出的擔(dān)憂，并提供解決方案。

其本意也是支持健康的新聞生態(tài)系統(tǒng)，并實(shí)現(xiàn)互利互惠，具體包括：

（1）通過部署他們的產(chǎn)品，來協(xié)助新聞從業(yè)者完成一些耗時(shí)的任務(wù)，比如分析大量公共記錄和翻譯故事，最終讓編輯和記者從中受益。

（2）通過對(duì)歷史、非公開內(nèi)容進(jìn)行訓(xùn)練，向他們的AI模型傳授世界知識(shí)。

（3）在ChatGPT回答中顯示帶有歸屬信息的實(shí)時(shí)內(nèi)容，為新聞發(fā)布者與讀者建立聯(lián)系。

2、訓(xùn)練屬于合理使用，提供退出機(jī)制

OpenAI此前就在提交給英國上議院的一份意見書中警告稱：

如果沒有受版權(quán)內(nèi)容的訓(xùn)練，我們的模型就將無法運(yùn)行。

在此，OpenAI再次表示，使用公開的互聯(lián)網(wǎng)材料訓(xùn)練AI模型是合理的，既對(duì)創(chuàng)作者公平、對(duì)創(chuàng)新者必要，也對(duì)國家的競(jìng)爭力至關(guān)重要。

并指出這一觀點(diǎn)已經(jīng)在美國得到很多團(tuán)體、學(xué)者的支持，在其他國家和地區(qū)例如歐盟、日本、新加坡等甚至有法律支持對(duì)受版權(quán)保護(hù)的內(nèi)容進(jìn)行訓(xùn)練。

不過，話鋒一轉(zhuǎn)，本著“合法權(quán)利對(duì)我們來說不如成為好公民重要”，OpenAI表示自己提供了一個(gè)簡單的退出流程，可以防止他們的AI模型再次訪問這些網(wǎng)站數(shù)據(jù)。

據(jù)介紹，紐約時(shí)報(bào)已經(jīng)于2023年8月采用這一機(jī)制，退出OpenAI的訓(xùn)練。

3、“反流”是罕見錯(cuò)誤，希望用戶也不要故意引導(dǎo)

所謂“反流”（Regurgitation），其實(shí)就是指模型輸出和訓(xùn)練數(shù)據(jù)一模一樣的內(nèi)容。

紐約時(shí)報(bào)在訴訟中就列出ChatGPT和該家新聞驚人雷同的情況：

對(duì)于這一文縐縐的表達(dá)，有網(wǎng)友是不滿的：不就是抄襲（plagarism）嗎？

但不管怎么說，OpenAI的解釋是：

當(dāng)特定內(nèi)容在訓(xùn)練數(shù)據(jù)中多次出現(xiàn)時(shí)就會(huì)出現(xiàn)這種罕見的錯(cuò)誤，不過我們已經(jīng)采取了措施來防止情況出現(xiàn)。

以及，OpenAI也特別勸誡用戶：

采取負(fù)責(zé)任的行為，不要故意操縱模型進(jìn)行反流，這既是對(duì)我們技術(shù)的不當(dāng)使用，也違反了我們的使用條款。

然而，馬庫斯和一位數(shù)字插畫家?guī)滋烨霸?lián)合撰文，列出包括 DALL-E 3在內(nèi)的AI模型如何在沒有明確提示的情況下的不少“反芻數(shù)據(jù)”，也就是給出一些明顯和已有作品場(chǎng)景基本相似的圖片等內(nèi)容。

而這，就使得OpenAI的說法有些矛盾。

最后，在本段末尾，OpenAI還來了一句：

模型是從人類知識(shí)的巨大集合中學(xué)習(xí)的，因此任何一類數(shù)據(jù)（包括新聞）都只是整體訓(xùn)練數(shù)據(jù)的一小部分，任何單一數(shù)據(jù)源（包括紐約時(shí)報(bào)在內(nèi)），對(duì)于模型的知識(shí)學(xué)習(xí)都并不重要。

4、完整故事被隱藏，收到起訴后驚訝又失望

OpenAI透露，在去年12月19日時(shí)，其實(shí)已經(jīng)和紐約時(shí)報(bào)取得了建設(shè)性談判進(jìn)展，包括在回答中實(shí)時(shí)顯示來源和跳轉(zhuǎn)等，并和紐約時(shí)報(bào)解釋：

與任何單一來源一樣，你們的內(nèi)容對(duì)我們現(xiàn)有模型的訓(xùn)練沒有任何有意義的貢獻(xiàn)，也不會(huì)對(duì)未來的訓(xùn)練產(chǎn)生足夠的影響。

然而OpenAI表示沒想到，12月27號(hào)就被直接起訴了，并且還是通過紐約時(shí)報(bào)的消息才知道——心情整個(gè)就是一個(gè)既驚訝又失望。

在此，OpenAI指出，對(duì)于紐約時(shí)報(bào)指出的”反流”情況（也就是回答逐字抄寫紐約時(shí)報(bào)新聞），他們很努力解決這個(gè)問題，拿出了誠意，并曾要求后者分享示例，但一再遭到拒絕。

更有趣的是，OpenAI發(fā)現(xiàn)，所謂的“反流”內(nèi)容，其實(shí)是多年前多個(gè)第三方網(wǎng)站上大量傳播的文章（即并非來自紐約時(shí)報(bào)）。

以及紐約時(shí)報(bào)可能涉嫌故意操縱提示詞——放進(jìn)去大段原文讓模型“上當(dāng)”。

OpenAI表示，按照他們這么操作，模型其實(shí)也并沒有像紐約時(shí)報(bào)展示的那樣夸張。

這說明：他們要么故意引導(dǎo)模型，要么進(jìn)行過精挑細(xì)選。

綜合以上，OpenAI認(rèn)為：

紐約時(shí)報(bào)的訴訟毫無根據(jù)。

不過緩和的場(chǎng)面話也是有的：

我們?nèi)匀幌Ｍc其建立合作伙伴關(guān)系，畢竟它曾在60年前報(bào)道了第一個(gè)有效工作的神經(jīng)網(wǎng)絡(luò)。

前情回顧

去年12月27日，紐約時(shí)報(bào)突然一紙狀書、220000頁附件，遞交到地方法院狀告OpenAI侵權(quán)，當(dāng)然還包括微軟。

訴狀中指出，紐約時(shí)報(bào)的文章構(gòu)成了Common Crawl中用于訓(xùn)練GPT的最大單個(gè)專有數(shù)據(jù)集。

基于此，他們找到了多達(dá)100個(gè)鐵證，證明ChatGPT輸出內(nèi)容與紐約時(shí)報(bào)新聞內(nèi)容幾乎一模一樣。

并且有時(shí)由于幻覺問題，模型還會(huì)以紐約時(shí)報(bào)的名義“造謠”，生成一些假新聞，例如橙汁會(huì)導(dǎo)致淋巴癌，這也對(duì)他們的名聲造成了困擾。

對(duì)此，紐約時(shí)報(bào)的訴求是：

要求OpenAI和微軟銷毀包含侵權(quán)材料的模型和訓(xùn)練數(shù)據(jù)，并對(duì)非法復(fù)制和使用《紐約時(shí)報(bào)》獨(dú)有價(jià)值的作品相關(guān)的“數(shù)十億美元的法定和實(shí)際損失”負(fù)責(zé)。

由于證據(jù)充足、律師團(tuán)隊(duì)強(qiáng)大，網(wǎng)友直呼這是一起“見證AI侵權(quán)里程碑式的案件”、“恐怕不能再像之前擺平其他出版商那樣三瓜兩棗就打發(fā)了”。

據(jù)了解，去年4月份時(shí)，紐約時(shí)報(bào)就與OpenAI談判，但沒談妥，OpenAI拒絕達(dá)成協(xié)議。

原因可能是金額巨大，特別是考慮到OpenAI利潤的增長以及類似案例的增多。

有一個(gè)大膽猜測(cè)是，OpenAI可能想用七至八位數(shù)金額（百萬美元/千萬美元）解決此事，但紐約時(shí)報(bào)所追求的是更高的賠償和持續(xù)的版稅收入。

Ps. OpenAI年收入在16億美元左右，每年用于買授權(quán)文章和材料進(jìn)行訓(xùn)練的金額在100萬美元至500萬美元之間。

這次，網(wǎng)友站哪邊？

有網(wǎng)友指出，這起案子的關(guān)鍵是“訓(xùn)練是否為合理使用”，而他認(rèn)為：

模型的輸出可能會(huì)侵權(quán)，但輸入不會(huì)。

但有人諷刺道：

當(dāng)你擁有數(shù)十億美元時(shí)，一切都是合理使用。

也有人提出：

我同意為合理使用，但前提是你開源。

并有人附和：

確實(shí)強(qiáng)調(diào)非營利性組織很重要。

此外，對(duì)于OpenAI提出的退出機(jī)制，有一位作家網(wǎng)友不滿的聲音也得到了很多支持：

光退出，也就是禁止你們的模型讀取我的個(gè)人網(wǎng)站還不夠，我還需要你仔細(xì)檢查并從訓(xùn)練數(shù)據(jù)中完全刪除我的內(nèi)容。

結(jié)局究竟會(huì)如何？

一項(xiàng)調(diào)查顯示，有59%的受訪者認(rèn)為，不應(yīng)允許人工智能公司使用出版商內(nèi)容來訓(xùn)練模型。

而70%的人表示，如果公司想在模型訓(xùn)練中使用受版權(quán)保護(hù)的材料，則應(yīng)向出版商進(jìn)行補(bǔ)償。

看起來，輿論似乎是站在紐約時(shí)報(bào)這一邊的。

你覺得這個(gè)案子應(yīng)該怎么判？

參考鏈接：

[1]https://openai.com/blog/openai-and-journalism

[2]https://x.com/OpenAI/status/1744419710635229424?s=20

[3]https://www.ft.com/content/04861d1e-2e9f-4b92-a294-8d0c223a8287

[4]https://techcrunch.com/2024/01/08/openai-claims-ny-times-copyright-lawsuit-is-without-merit/

[5]https://www.theregister.com/2024/01/08/midjourney_openai_copyright/

[6]https://x.com/AndrewYNg/status/1744433663969022090?s=20

[7]https://x.com/futuristflower/status/1744422698636218807?s=20

本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。

如果侵犯了你的權(quán)益請(qǐng)來信告知我們刪除。郵箱：business@qudong.com

標(biāo)簽： ChatGPT OpenAI

上一篇:Intel Core i5-14400上手：千元級(jí)甜品真香處理器

下一篇:首發(fā)3799起！九號(hào)電動(dòng)車遠(yuǎn)行者Fz MIX發(fā)布：新國標(biāo)、自帶黑匣子

玩弄放荡人妇系列av在线网站,日韩黄片,人人妻人人添人人爽,欧美一区,日本一区二区三区在线 |观看,日本免费a级毛一片

OpenAI開撕紐約時(shí)報(bào)：故意引導(dǎo)ChatGPT得出抄襲結(jié)論

相關(guān)文章

猜你喜歡

網(wǎng)購9.9元商品后惡意“僅退款”！拼多多商家起訴買家贏了：獲賠150元

網(wǎng)紅撒鹽哥硬拉梅西合照遭網(wǎng)暴網(wǎng)友吐槽：不禮貌、純蹭熱度

女子32層窗外無防護(hù)擦玻璃拍攝者：太危險(xiǎn)了

鱷魚冬眠罕見畫面曝光：只有鼻孔露出冰層仿佛凍僵

《美人魚2》曝2024年春節(jié)上映周星馳經(jīng)紀(jì)人辟謠

媒體：梅西爽約突破商業(yè)底線人形廣告牌被踢飛腦袋

玩弄放荡人妇系列av在线网站,日韩黄片,人人妻人人添人人爽,欧美一区,日本一区二区三区在线 |观看,日本免费a级毛一片

OpenAI開撕紐約時(shí)報(bào)：故意引導(dǎo)ChatGPT得出抄襲結(jié)論

相關(guān)文章

猜你喜歡

網(wǎng)購9.9元商品后惡意“僅退款”！拼多多商家起訴買家贏了：獲賠150元

網(wǎng)紅撒鹽哥硬拉梅西合照遭網(wǎng)暴 網(wǎng)友吐槽：不禮貌、純蹭熱度

女子32層窗外無防護(hù)擦玻璃 拍攝者：太危險(xiǎn)了

鱷魚冬眠罕見畫面曝光：只有鼻孔露出冰層 仿佛凍僵

《美人魚2》曝2024年春節(jié)上映 周星馳經(jīng)紀(jì)人辟謠

媒體：梅西爽約突破商業(yè)底線 人形廣告牌被踢飛腦袋

網(wǎng)購9.9元商品后惡意“僅退款”！拼多多商家起訴買家贏了：獲賠150元

網(wǎng)紅撒鹽哥硬拉梅西合照遭網(wǎng)暴網(wǎng)友吐槽：不禮貌、純蹭熱度

女子32層窗外無防護(hù)擦玻璃拍攝者：太危險(xiǎn)了

鱷魚冬眠罕見畫面曝光：只有鼻孔露出冰層仿佛凍僵

《美人魚2》曝2024年春節(jié)上映周星馳經(jīng)紀(jì)人辟謠

媒體：梅西爽約突破商業(yè)底線人形廣告牌被踢飛腦袋