![]()
▲用Perplexity搜索“谷歌前CEO Eric Schmidt的AI無(wú)人戰(zhàn)斗機(jī)”,Perplexity的回答出現(xiàn)了問(wèn)題,P2為Perplexity引用的網(wǎng)址,該網(wǎng)頁(yè)刊登AI生成文章的網(wǎng)頁(yè)
為了更好地了解GPTZero打假AI的能力,烏鴉君將不同類(lèi)型的內(nèi)容交給GPTZero識(shí)別。從結(jié)果來(lái)看,GPTZero基本能夠準(zhǔn)確分辨人或者AI創(chuàng)作的內(nèi)容。
![]()
比如,在我的提示下,GPT-4創(chuàng)作了小故事《西游記新編(一)》,GPTZero準(zhǔn)確地檢測(cè)出AI內(nèi)容(AI生成內(nèi)容占比100%)。另外,對(duì)于Claude和文心一言創(chuàng)作的內(nèi)容,GPTZero也能夠得出較準(zhǔn)確的結(jié)論。
而面對(duì)AI和人類(lèi)共同創(chuàng)作的內(nèi)容,比如我和GPT-4共同撰寫(xiě)的小故事《西游記新編(二)》,GPTZero識(shí)別的結(jié)果會(huì)相對(duì)偏離真實(shí)情況。
說(shuō)起來(lái),GPTZero的工作原理其實(shí)并不復(fù)雜,就是通過(guò)AI算法分析文本的復(fù)雜度和模式,從而判斷其可能的來(lái)源。
烏鴉君將其翻譯成下面這個(gè)秘訣,記住它,你也能變成一眼識(shí)AI:
越簡(jiǎn)單的文字越可能是AI寫(xiě)的,越難懂的文字越可能是人類(lèi)寫(xiě)的。
對(duì)比AI來(lái)說(shuō),人類(lèi)寫(xiě)出的東西的不難被理解,而且還會(huì)不自然。這有些逆反普通人的認(rèn)知了。當(dāng)GPTZero對(duì)一段文字的困惑越多,說(shuō)明這篇文章越接近人類(lèi)寫(xiě)作的特征。
原因在于,AI生成的文本內(nèi)容,文字會(huì)更可能通順而自然,也更容易預(yù)測(cè),不會(huì)給GPTZero造成理解障礙。而人類(lèi)的寫(xiě)作則不同,它往往會(huì)包含更具創(chuàng)意的詞語(yǔ)選擇,甚至偶爾還會(huì)出現(xiàn)拼寫(xiě)錯(cuò)誤等問(wèn)題,會(huì)讓GPTZero萌生出多個(gè)問(wèn)號(hào)。
還有一個(gè)識(shí)別AI的訣竅,就是人類(lèi)寫(xiě)作的節(jié)奏感,AI學(xué)不來(lái)。
文字的節(jié)奏感,指的是人們文字在表達(dá)過(guò)程中通過(guò)聲調(diào)、節(jié)奏、押韻等方式所形成的音樂(lè)感和流暢感。這東西AI根本學(xué)不會(huì),AI比人類(lèi)偏好書(shū)寫(xiě)句子長(zhǎng)度平均、結(jié)構(gòu)常規(guī)、風(fēng)格單調(diào)的東西。
說(shuō)完了訣竅,我們看看GTPZero還有哪些功能。除了最核心的AI文本內(nèi)容檢測(cè)外,GTPZero還內(nèi)置了“人類(lèi)寫(xiě)作認(rèn)證”,這是他們基于專(zhuān)有寫(xiě)作模式分析器推出的功能(認(rèn)證文檔確實(shí)由人類(lèi)寫(xiě)作,而非AI生成)。
GPTzero在去年1月走紅,最初的客戶(hù)是教師群體,宣稱(chēng)自己可以幫忙檢測(cè)AI生成的學(xué)生作業(yè),到如今,GPTZero的客戶(hù)群體已經(jīng)從單一的教師群體擴(kuò)展為,政府采購(gòu)機(jī)構(gòu)、慈善機(jī)構(gòu)、招聘經(jīng)理、數(shù)據(jù)標(biāo)注員等。
GPTZero將遠(yuǎn)期目標(biāo)定位于AI幻覺(jué)檢測(cè)。由于幻覺(jué)是生成式AI行業(yè)的難以根除的問(wèn)題,這家公司預(yù)備推出基于LLM訓(xùn)練數(shù)據(jù)集的免費(fèi)AI文本版權(quán)檢查,幫助他們生成更廣泛的幻覺(jué)檢測(cè)訓(xùn)練數(shù)據(jù)。
隨著AI生成創(chuàng)新工具集中爆發(fā),AI假圖假視頻盛行。
從去年開(kāi)始,AI打假應(yīng)用發(fā)展迅猛,可檢測(cè)的類(lèi)型涵蓋文字、圖片、視頻、音頻等內(nèi)容形態(tài),技術(shù)涉及分類(lèi)器、水印和元數(shù)據(jù)等。
除了剛剛提過(guò)的文字檢測(cè)工具,在圖像檢測(cè)領(lǐng)域,也出現(xiàn)了許多檢測(cè)圖像的真實(shí)性、來(lái)源以及是否經(jīng)過(guò)篡改的反AI工具。比如通過(guò)分析圖像的像素特征、元數(shù)據(jù)、與已知數(shù)據(jù)庫(kù)的對(duì)比等方式來(lái)進(jìn)行判斷,例如AI or Not和Nuanced。
在聲音、音頻內(nèi)容檢測(cè)工具方面,有以下一些技術(shù)可以實(shí)現(xiàn),如基于音頻特征分析(細(xì)分為韻律特征、頻譜特征分析),還有利用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型(細(xì)分為訓(xùn)練分類(lèi)器、異常檢測(cè))等。例如Project Mockingbird(聲音檢測(cè))、AI-generated Detector(音樂(lè)檢測(cè))
以下是一些烏鴉君認(rèn)為值得關(guān)注的AI檢測(cè)型工具:
1、多媒體內(nèi)容審核工具Hive AI,打擊電商虛假宣傳
AI生成時(shí)代,可能會(huì)讓虛假宣傳更加猖獗。就拿網(wǎng)購(gòu)來(lái)說(shuō),如果大量商家使用AI生成式圖片,普通人可能會(huì)相信虛假的效果而去購(gòu)買(mǎi)商品。商家有必要去克制AI假圖、假視頻在購(gòu)物平臺(tái)上的含量。
Hive AI就是當(dāng)下較為全能的AI檢測(cè)工具,無(wú)論是文本、圖像還是視頻,都能幫助客戶(hù)識(shí)別AI內(nèi)容。通過(guò)將上傳的照片與在線(xiàn)文本材料、圖片、視頻庫(kù)進(jìn)行對(duì)比,找出AI生成的內(nèi)容。
Hive AI如今已經(jīng)有各種各樣的使用案例,主要應(yīng)用于社交和電子商務(wù)平臺(tái),比如支付平臺(tái)Visa、網(wǎng)劇平臺(tái)Netflix、社交平臺(tái)Reddit。憑借在多個(gè)平臺(tái)進(jìn)行識(shí)別的優(yōu)勢(shì),Hive AI在去年完成新一輪2億美元融資(但信息未公開(kāi))。
2、高端多媒體檢測(cè)工具AI or Not,已獲10萬(wàn)用戶(hù)
AI or Not是面向新聞媒體、社交平臺(tái)、電子商務(wù)的多媒體檢測(cè)工具,和上述工具不同的是,它能提供詳細(xì)的分析報(bào)告。
具體來(lái)說(shuō),AI or Not可以分析文本內(nèi)容,識(shí)別是否由AI生成,如GPT-3或其他語(yǔ)言模型。圖片方面,它可以利用深度學(xué)習(xí)技術(shù)檢測(cè)圖像是否經(jīng)過(guò)AI生成或編輯,識(shí)別深偽(Deepfake)圖像,也就是說(shuō),它對(duì)AI圖像檢測(cè)的力度更大。
另外,它也可以分析視頻內(nèi)容,檢測(cè)是否經(jīng)過(guò)AI生成或修改,如Deepfake視頻。提供幀級(jí)別的分析,確保檢測(cè)結(jié)果的準(zhǔn)確性和細(xì)節(jié)。
目前月度收費(fèi)為個(gè)人版5美元/月,企業(yè)版250美元/月。該收費(fèi)工具目前已經(jīng)獲得了10萬(wàn)用戶(hù),看來(lái)國(guó)外比較愿意為這種社交內(nèi)容打假付費(fèi)。
![]()
▲使用范例
3、監(jiān)控也要防范AI造假,Nuanced準(zhǔn)確率高達(dá)97%
相比上面主要面向深度仿真、藝術(shù)原創(chuàng)性的AI or Not,Nuanced更適用于超市監(jiān)控、貨物倉(cāng)儲(chǔ)情況等對(duì)圖像質(zhì)量要求不高的低端場(chǎng)景。
Nuanced這個(gè)詞本身有“微妙的”“具有細(xì)微差別的”的意思。也就是說(shuō),Nauanced可以對(duì)一段監(jiān)控報(bào)告視頻進(jìn)行精細(xì)的檢測(cè)。具體來(lái)說(shuō),Nauanced不只是檢測(cè)人和貨物,還能辨別細(xì)微差別,例如面部表情、人們之間的互動(dòng)以及環(huán)境背景。
另外,Nuanced實(shí)時(shí)高效處理大量圖像,適合在線(xiàn)和離線(xiàn)應(yīng)用。
4、預(yù)防電話(huà)詐騙,檢測(cè)工具Project Mockingbird準(zhǔn)確率達(dá)90%
AI聲音的影響可能比我們想象中得更大,不法分子盯上老年人,利用AI生成的聲音進(jìn)行詐騙。央視網(wǎng)報(bào)道,去年11月,有騙子用AI生成的受害者親人的聲音詐騙,騙去40萬(wàn)。
殺毒軟件McAfee公司推出聲音檢測(cè)工具Project Mockingbird,幫助用戶(hù)檢測(cè)、阻止AI生成的語(yǔ)音詐騙行為的項(xiàng)目。它基于由AI驅(qū)動(dòng)的 “深度偽造” 音頻檢測(cè)技術(shù),在聆聽(tīng)給定的語(yǔ)音之后,可檢測(cè)音頻是否為真人發(fā)音。
為了在視頻中精準(zhǔn)定位并識(shí)別可能由AI生成的音頻片段,Project Mockingbird還融合了 AI 驅(qū)動(dòng)的上下文、行為和分類(lèi)檢測(cè)模型。官方聲稱(chēng)該工具成功率超過(guò)90%,目前還不向用戶(hù)收取額外費(fèi)用。
5、一分鐘掃5000首歌,幫助唱片平臺(tái)防止發(fā)布的AI音樂(lè)侵權(quán)
AI生成的音樂(lè)一直伴隨著版權(quán)爭(zhēng)議,就連OpenAI都有暗示過(guò)GPT-4o生成的音樂(lè)可能會(huì)侵犯別的音樂(lè)的版權(quán)。
音樂(lè)發(fā)行商如何自我防范?現(xiàn)在已經(jīng)有專(zhuān)門(mén)檢測(cè)AI生成式音樂(lè)的工具——AI-Generated Detecto,這項(xiàng)工具一分鐘內(nèi)可以?huà)呙?000首曲目!并保證準(zhǔn)確率高達(dá)98.5%。
這是巴黎蓬皮杜音樂(lè)技術(shù)研究中心IRCAM的IRCAM Amplify公司推出的識(shí)別AI生成音樂(lè)的工具,目標(biāo)客戶(hù)主要是唱片公司、出版商、版權(quán)管理組織和音樂(lè)流媒體平臺(tái)。
![]()
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論
用AI打假AI火爆起來(lái)了
有點(diǎn)像AI生成的殺毒軟件
人類(lèi)寫(xiě)作的節(jié)奏感,AI學(xué)不來(lái)
對(duì)比AI來(lái)說(shuō),人類(lèi)寫(xiě)出的東西不難被理解
AI生成的內(nèi)容過(guò)于公式化