![]()
圖片來源@視覺中國
文 | 太平洋科技
全球都在關注著這個可能決定人類命運的官司。
在2023年的年尾,AI界的巨頭OpenAI和其合作伙伴微軟,一同被老牌頭部媒體《紐約時報》告上法庭。
指控的理由,是ChatGPT非法使用了《紐約時報》數百萬篇原創(chuàng)文章,嚴重侵犯了《紐約時報》的權益。
在沉默了近兩周之后,OpenAI終于作出了回應:毫不避諱地承認了使用過《紐約時報》文章的事實,但稱其是“合理使用”,并且表示如果不使用受版權保護的作品,ChatGPT這樣的AI產品就無以發(fā)展。
這不禁讓人想起十年前,因算法模式而強勢崛起的今日頭條,同樣因侵犯版權被眾多媒體起訴;更早的二十年前,全球最大科技公司之一的谷歌,因建立數字圖書館而被作者協會集體上訴。
這些往事都早已有了結局。今日頭條選擇花錢“交個朋友”,邀請媒體入駐,并且定期支付千萬級別的版權費用。而谷歌在經歷了漫長的十年糾纏之后,以“合理使用”原則贏得了訴訟。
此時此刻,恰如彼時彼刻,如今站上法庭的AI科技巨頭與媒體大亨,同樣因內容版權問題而交鋒。不過,歷史雖然總是驚人的相似,但絕不會簡單地重復。
新舊世界的對決
故事的主角OpenAI,可以說是AI科技行業(yè)當之無愧的“C位”,被視為構建AGI(通用人工智能)的“金種子”,人類社會通往下一個時代的鑰匙。
而另一位主角《紐約時報》是美國老牌媒體,依靠數字訂閱服務,依然在互聯網時代保持著行業(yè)翹楚的地位,是全球新聞內容市場的中堅力量。這場比拼,可謂精彩絕倫。
在第一輪的對決中,《紐約時報》就直接要求“摧毀”所有大語言模型以及包含其版權內容的數據集,并且賠償損失和相關費用。
PConline查閱發(fā)現,《紐約時報》69頁的上訴書中,近50頁的內容都在描述OpenAI及微軟侵犯版權的證據。
上訴書不僅以可視化的形式展現了ChatGPT的侵權行為,還補充了許多數據支撐,資料厚度是從前AI版權案例的幾倍,內容之詳細,邏輯之清晰,都體現了《紐約時報》為起訴做足了準備。
因此知名律師Cecilia Ziniti在看過上訴書之后,認為這將會是一次AI侵權領域“里程碑式的案件”。
![]()
《紐約時報》列出的證據,紅色為ChatGPT與《紐約時報》內容一致的部分
《紐約時報》獲得了一波網友的支持,許多人都認為AI在“毫無底線”地侵犯版權。但對于《紐約時報》的訴求—— “摧毀”大語言模型,網友們都持懷疑的態(tài)度。
其實OpenAI也對《紐約時報》拋出過合作的橄欖枝。有消息稱,OpenAI曾向《紐約時報》提出過500萬美元或更少的賠償條件。然而,在《紐約時報》的上訴書中,雖然沒有要求具體的賠償金額,但表達過要求OpenAI賠償其數字業(yè)務受損害的部分。而這一部分,也正是《紐約時報》的支柱業(yè)務。
《紐約時報》2022年的財報顯示,數字訂閱收入達到14.79億美元,占全年總收入的64.08%。這樣看來,OpenAI提出的500萬美元確實顯得沒有誠意。但從主動尋求合作的行為中不難看出,OpenAI自知理虧。所以在多次公開發(fā)言中,OpenAI選擇另一個“防護盾”——合理使用。
“合理使用”是版權法的一種寬松處理,對于一些特殊的場景給予使用版權的權利。判斷是否“合理使用”時,有多個考慮因素:使用版權對市場/公共利益的影響、使用版權的主體是否盈利等。
OpenAI選擇站在科技發(fā)展、公共利益的角度為自己辯護:極力強調龐大的數據訓練集是AI發(fā)展的必經之路。并且,只使用公共領域的內容的話,AI的發(fā)展水平就達不到當前社會的需求。
當然,在公共利益的話題上,《紐約時報》也是有備而來。
《紐約時報》早已料到OpenAI會作此反應,在上訴書中,專門提到了“AI幻覺”的問題。“AI幻覺”是指AI有時會生成一些看似連貫,實則錯誤的回答。但錯誤或虛假的信息會誤導用戶,從而造成不良的公共影響,所以OpenAI能否證明其公共利益的屬性,還得存疑。
另外,《紐約時報》直指OpenAI的“盈利目的”。OpenAI起初為“非營利”組織,但現在早已不再開源,依靠AI的服務,每月收入8000萬美元。(據消息稱,OpenAI在2023年的年收入已經超過16億美元。)
雙方在不同的價值追求下,對自身的立場都有著同樣的執(zhí)著??萍夹袠I(yè)和新聞出版行業(yè)似乎每十年都會進行一次這樣的“巔峰對決”。但更有趣的是,“對決”背后的草灰蛇線。
科技VS新聞出版:宿敵還是盟友?
將時間倒轉二十年,在美國聲名鵲起的科技企業(yè)谷歌提出了一個雄心勃勃的項目——谷歌圖書,試圖通過掃描創(chuàng)建圖書的數字版本,然后將電子圖書合并到谷歌的搜索功能中。
當時,每天都有幾大卡車的圖書送到谷歌總公司進行掃描,場面頗為壯觀。但這個項目很快引起了作者和出版商們的不滿。
作家協會以侵犯版權為由對谷歌提起訴訟。谷歌立即搬出“合理使用”的法律盾牌,聲稱這一項目是有利于公眾,同時也沒有損害原創(chuàng)作品的市場。同時谷歌也積極尋求和解,但被原告方拒絕。
這個案件可謂歷經波折,耗費了約十年的時間,最終法院基于“合理使用”的原則宣判谷歌勝訴。這也為數字時代版權評判標準的健全,補上了一塊拼圖。
十年前,相似的事情又在中國互聯網上演。2013年,被稱“新聞搬運工”的今日頭條在上線后,火速侵噬了新聞行業(yè)的大部分流量。
以《廣州日報》為首的傳統媒體隨即對今日頭條發(fā)起訴訟。《新京報》等眾多知名媒體也迅速群起而攻之,接連發(fā)表聲明,譴責今日頭條的侵權行為。
今日頭條一邊表態(tài)不存在侵權問題,一邊和媒體積極推進合作。最終今日頭條和眾多媒體達成和解,不僅花大價錢購買了新聞版權,還積極邀請各大媒體入駐,給予流量扶持和收益分成。
如今看來,OpenAI是想沿著“前輩們”的腳步過河。在對《紐約時報》上訴的第一次正式回應中,OpenAI將“與新聞機構合作并創(chuàng)造新的機會”作為首要立場,還搬出了和美聯社的合作作為支撐論據。
縱觀這三個案件,谷歌圖書案開始于門戶網站的興起階段,搜索引擎的興盛是那個時代的標志;今日頭條案發(fā)生在移動互聯網的崛起時刻,流量是當時搶占市場的關鍵;而今天的OpenAI案是AI技術獲得突破性進展,大顯身手的前夜,擁有像ChatGPT這樣生成式AI產品是公司股價飛升的秘訣。
這三個案件,雖處于不同的時代,但都發(fā)生在新技術“引爆”新時代之前。并且,故事的主角都是科技和新聞出版這樣兩個行業(yè)。
這一點,并不難理解。對于科技行業(yè)來說,技術的落地一定需要內容來支撐。而新聞出版業(yè)就是內容的集大成者。對于新聞出版行業(yè)來說,內容也需要迎合時代的發(fā)展,更新內容的形式。當然,科技的發(fā)展總是領先于時代,所以帶來了“技術的磨合期”——相應的市場規(guī)則和法律文書在這一階段進行完善。
“讀書人的事兒,能叫抄嗎?”
但AI的情況又有所不同。在科技公司看來,AI技術是以類人為導向的,許多AI大模型的衡量標準就是看輸出的內容能否接近,甚至超越人類專家的智慧。
所以技術的發(fā)展邏輯也是按照人的成長機制來踐行的。在學校里學習公開的材料,通過和身邊的人互動來增強對社會的認知,本質上與AI大模型的學習訓練是有共通之處的。只不過一個人在學校里用到的課本有幾十本,而ChatGPT則是“學習”了約1.76萬億個數據。
但AI公司們似乎沒意識到這套邏輯仍然難以自洽,學生們去學校學習知識再加以應用,以獲得個人的成長,是需要付出成本的,比如學費、書本費等,只不過這個成本往往是由社會福利來買單,無論誰來支付這筆成本,都明確顯示了成本是真實存在的。
但AI公司們似乎并不愿意聊到這個成本,他們普遍希望像OpenAI一樣免費獲取“紐約時報”們的內容來學習。與此同時,他們也并不愿意承擔AI造成的負面后果。
美國國家AI咨詢委員會成員Navrina Singh在參加一檔談話節(jié)目時就曾表示,目前科技公司很難對AI輸出的內容負責,因為他們沒有工具來細致處理“萬億”級別的數據。這也是科技巨頭們正在努力的方向。這也是OpenAI與《紐約時報》這場巔峰對決產生的意義——AI和人類的“磨合期”已經到來。不僅是AI侵權問題,還有“AI幻覺”、失業(yè)潮等都是“磨合期的陣痛”。AI技術需要適應人類社會,我們也需要了解新的技術,在新的時代找到自己的定位。
時代滾滾向前,時間會證明潮水的方向。谷歌圖書案之后,數字生態(tài)逐漸成為了極具公益價值的一環(huán),越來越多的古籍文物再也無懼歲月變遷,在數字世界中成為了人類永恒的財富;今日頭條案之后,傳統媒體加快融媒轉型的步伐,在新的媒介傳播時代中煥發(fā)新生;相信在這次《紐約時報》訴OpenAI案之后,AI產業(yè)會激發(fā)出更多意想不到的創(chuàng)新。
不管這次案件判決如何,都有著巨大的象征意義。畢竟與傳統產業(yè)“對決”的輸贏,并不是AI發(fā)展的最終目的,各方尋求共贏的合作,共創(chuàng)AI時代的未來才是。
![]()

快報
根據《網絡安全法》實名制要求,請綁定手機號后發(fā)表評論