圖片來源@視覺中國(guó)
鈦媒體注:本文來自微信公眾號(hào)淺黑科技(ID:qianheikeji),作者: 謝幺,鈦媒體經(jīng)授權(quán)發(fā)布。
“媽耶,做號(hào)集團(tuán)真牛逼!敢這么直接找上門啊。。。”
“太明目張膽了這些人!”
某內(nèi)容平臺(tái)的工作群被一張聊天截圖炸開了鍋,一位作者向平臺(tái)舉報(bào)說有“做號(hào)黨”主動(dòng)向他尋求“合作”。
對(duì)方不僅聲稱登錄過作者的賬號(hào),還直接甩出了登錄密碼,說“看你做不出來收益,所以才想和你合作”,頗有種“老子找你是看得起你”的架勢(shì)。
![]()
對(duì)話框左邊是做號(hào)黨,右邊是號(hào)主
究竟發(fā)生了什么?
“我估計(jì)是平臺(tái)更新了安全策略,做號(hào)黨原來盜來的賬號(hào)無法登錄了。” 丁丁告訴我。
丁丁不是天線寶寶四人組里的“丁丁”,而是騰訊企鵝號(hào)平臺(tái)安全部的一位技術(shù)小哥。日常工作是跟黑產(chǎn)們 “貼身肉搏”,防止平臺(tái)被薅羊毛,確保平臺(tái)安全。出于尊重個(gè)人意愿,不透露真實(shí)姓名和職務(wù),姑且用“丁丁”代替。
半個(gè)月前,丁丁和同事們對(duì)做號(hào)集團(tuán)們來了一次“地毯式轟炸” —— 直接停用了“手機(jī)號(hào)/郵箱登錄+密碼”的登錄方式,只允許用綁定QQ和微信掃碼登錄,這一下就斬?cái)嗔瞬簧僮鎏?hào)黨的財(cái)路。
“做號(hào)黨手里的賬號(hào)來源一般有兩種:一是用機(jī)器自動(dòng)化大批量注冊(cè),二是通過撞庫(kù)等手段盜過來別人的賬號(hào)密碼。”
丁丁告訴我,無論哪種,都免不了用手機(jī)號(hào)/郵箱號(hào)+密碼登錄,現(xiàn)在平臺(tái)直接停用賬號(hào)密碼登錄,做號(hào)黨手中的一大批賬號(hào)將被廢棄。
在對(duì)陣做號(hào)集團(tuán)的漫長(zhǎng)戰(zhàn)爭(zhēng)里,丁丁和同事們又贏了一場(chǎng)戰(zhàn)役。但僅僅在一個(gè)月之前,他們還深陷在一場(chǎng)眾所周知的因?yàn)楸I號(hào)、做號(hào)黨引發(fā)的質(zhì)疑之中。
并非所有幕后努力都能被人看見,所以我決定和他們聊聊日常,看看內(nèi)容平臺(tái)和“做號(hào)黨”之間究竟發(fā)生過怎樣的攻防對(duì)抗?以及,為什么騰訊辣么有錢,依然滅不掉做號(hào)黨?
“注冊(cè)賬號(hào)是每個(gè)黑灰產(chǎn)薅羊毛的必經(jīng)之路。” 丁丁告訴我,倘若來者不拒,企鵝號(hào)每天得有四到五萬個(gè)新增用戶。但用膝蓋也能想到,龐大的注冊(cè)量中必然混入了不少黑灰產(chǎn),所以他的工作之一就是在路口布防,攔截一切可疑注冊(cè)者。
透過安全數(shù)據(jù),丁丁能感受到做號(hào)黨們的脈搏。
他說,“每次實(shí)施新的防御策略,做號(hào)黨的活動(dòng)跡象都以肉眼可見的速度減少,沒過多久又會(huì)反彈,像一群總滅不干凈的小強(qiáng)。”
企鵝號(hào)的第一道防御線——黑產(chǎn)庫(kù),來自盟友騰訊安全平臺(tái)部。
這個(gè)部門相當(dāng)于整個(gè)騰訊公司的保鏢,職責(zé)是保護(hù)騰訊全線產(chǎn)品的安全,丁丁一般親切地簡(jiǎn)稱它“安平”。
安平的一項(xiàng)日常工作就是搜羅各種行為可疑的 IP、手機(jī)號(hào)、郵箱地址等數(shù)據(jù),給他們打上標(biāo)簽,匯成一個(gè)龐大的“黑產(chǎn)庫(kù)”,提供給騰訊系的各個(gè)產(chǎn)品線,幫小伙伴們鑒別正常注冊(cè)和惡意注冊(cè)。
丁丁告訴我,“企鵝號(hào)接入黑產(chǎn)庫(kù)就等于在注冊(cè)環(huán)節(jié)加了一道過濾網(wǎng)。效果立竿見影,每天注冊(cè)量一下就降到兩三萬。” 也就是說,有兩三萬次惡意注冊(cè)來自做號(hào)集團(tuán),被攔掉了。
為啥做號(hào)集團(tuán)這么執(zhí)著于注冊(cè)賬號(hào)這件事?很簡(jiǎn)單,對(duì)做號(hào)團(tuán)伙來說,號(hào)就是錢。
“一個(gè)企鵝號(hào)每天限制發(fā)5篇文章,兩個(gè)賬號(hào)就能一天發(fā)10篇,三個(gè)就15篇……發(fā)得文章越多,收益自然就越高。”
在利益的驅(qū)使下,做號(hào)團(tuán)伙非常勤奮,別說一天五篇,十五篇,甚至二十五篇都不在話下,對(duì)賬號(hào)的需求數(shù)當(dāng)然大。
丁丁告訴我,做號(hào)已經(jīng)形成一條完整的產(chǎn)業(yè)鏈。
“有人專門‘下號(hào)’(提供賬號(hào)),有人專門收集個(gè)人信息做實(shí)名認(rèn)證,有人負(fù)責(zé)炮制內(nèi)容吸引流量,用平臺(tái)補(bǔ)貼、廣告等方式變現(xiàn),下游還有人專門給他們提供刷量服務(wù)。”
從上至下環(huán)環(huán)相扣,明確分工。
“下號(hào)”是重要的一環(huán),主要通過程序批量注冊(cè)、撞庫(kù)盜號(hào)等手法。依照不同平臺(tái)的注冊(cè)和盜號(hào)難度,每個(gè)賬號(hào)通常就能賣十幾元到幾十元不等,有實(shí)名認(rèn)證、原創(chuàng)認(rèn)證的賬號(hào)則售價(jià)更高,有的能賣到幾千塊一個(gè)。
丁丁說,“做號(hào)團(tuán)伙很狡猾,每天會(huì)換用各種手機(jī)號(hào)、郵箱,切換IP地址來偽裝成正常注冊(cè),試圖躲避黑產(chǎn)庫(kù)的攔截。所以我們當(dāng)然還有別的招。”
企鵝號(hào)的第二道防御線是實(shí)名認(rèn)證,只有實(shí)名認(rèn)證的賬號(hào)才能發(fā)布內(nèi)容。
業(yè)內(nèi)以往最通用的實(shí)名認(rèn)證方法是“上傳手持身份證照片”。簡(jiǎn)而言之,讓你捧著自己身份證拍張靚照,傳到平臺(tái)進(jìn)行人工審核。講真,這種認(rèn)證方式體驗(yàn)不好,總有種犯人拿著號(hào)碼牌拍照的感覺。就像這樣:
你可能有點(diǎn)納悶,Google 上怎么能隨手搜到那么多手持身份證照片呢?是的,很多人的身份認(rèn)證信息其實(shí)早就泄露了,所以魔高一尺,單純靠上傳手持身份證這種方法其實(shí)擋不住做號(hào)集團(tuán)。
去年9月份,溫州警方就破獲了一起公民信息買賣案。據(jù)通報(bào),該團(tuán)伙的手持身份證照片僅售幾毛錢一張。收集到“四件套”(手持身份證、手持報(bào)紙、手持白紙、身份證正反面)打包賣給“注冊(cè)商”,單價(jià)也就百來塊錢。
做號(hào)集團(tuán)便是所謂“注冊(cè)商”,典型買家。
圖片來自警方通報(bào)新聞
丁丁告訴我:“除了直接在地下黑市購(gòu)買,有的做號(hào)集團(tuán)還會(huì)雇人去農(nóng)村收身份證信息,這并不難。”
道高一丈,企鵝號(hào)的對(duì)抗方法是人臉識(shí)別。
騰訊公司有專門做人臉識(shí)別技術(shù)的團(tuán)隊(duì),正好又能幫上忙。“實(shí)名認(rèn)證時(shí)只要用人臉識(shí)別一查,冒用他人的身份信息肯定通不過,一下子就又把黑產(chǎn)的策略擊破了。”
丁丁說,人臉識(shí)別上線才幾天,每天新增的實(shí)名認(rèn)證數(shù)量猛降四五千,效果立竿見影。
但事兒還沒完,“做號(hào)集團(tuán)肯定會(huì)反撲,這是常態(tài)。”
平臺(tái)用人臉識(shí)別“大面積滅火”之后持續(xù)監(jiān)測(cè)數(shù)據(jù),不到一個(gè)月,實(shí)名登記數(shù)量果然又開始反彈,火星復(fù)燃了。
我問他:“是黑產(chǎn)有辦法騙過人臉識(shí)別?”
“倒不是,他們用了一種迂回策略來避開人臉識(shí)別。” 丁丁說,之前企鵝號(hào)平80%的賬號(hào)是個(gè)人號(hào),只有不到20%的企業(yè)號(hào)。人臉識(shí)別功能啟用后,個(gè)人號(hào)的日均實(shí)名認(rèn)證量迅速減少,企業(yè)號(hào)日均認(rèn)證量卻開始上漲。
兩三個(gè)月時(shí)間,企業(yè)號(hào)占比竟?jié)q到接近 70%。也就是說,做號(hào)團(tuán)伙們?yōu)榱硕惚芷脚_(tái)的打壓,從個(gè)人號(hào)集體涌入了機(jī)構(gòu)號(hào)。
這給企鵝號(hào)安全部門帶來一個(gè)難題。
“企業(yè)號(hào)實(shí)名認(rèn)證信息一般要求填企業(yè)法人,也就是公司老板的。但實(shí)際操作賬號(hào)的人通常是底下負(fù)責(zé)新媒體運(yùn)營(yíng)的普通員工,很少有公司老板親自來操作媒體賬號(hào)的。”
如果強(qiáng)行要求人臉識(shí)別,“小編”就得必須拽著自家老板來刷臉認(rèn)證,這會(huì)給正常企業(yè)用戶帶來困擾。
丁丁又想了一招 —— “要求企業(yè)號(hào)綁定公司的銀行賬戶,并且賬戶名必須和企業(yè)營(yíng)業(yè)執(zhí)照上的公司名相同。我們往賬戶里打一分錢,就能核對(duì)賬號(hào)真實(shí)性。
到這一步,坑又填上了。
“如此一來,做號(hào)黨豈不是無路可走了?”
“你放心,做號(hào)黨們一定會(huì)想出各種怪招,這場(chǎng)仗得一直打下去。” 丁丁說,就在前不久,他們又發(fā)現(xiàn)有大量賬號(hào)試圖用PS制作的假營(yíng)業(yè)執(zhí)照蒙混過關(guān),同事們正在商討針對(duì)性打壓策略,打算再加一層額外的校驗(yàn)系統(tǒng)。
他說和做號(hào)集團(tuán)對(duì)抗讓他深刻體會(huì)到一件事:做號(hào)集團(tuán)背后出活生生的人。
若你把做號(hào)團(tuán)伙當(dāng)成游戲里三拳兩腳就干掉的小兵嘍啰,試圖用一道墻,一個(gè)籬笆就攔住,他們就會(huì)用一次次反撲來告訴你他們是一個(gè)個(gè)真實(shí)“玩家”,有專業(yè)工程師,有統(tǒng)一指揮者,還有黑產(chǎn)盟友………
但平臺(tái)就無計(jì)可施了嗎?
“做號(hào)黨的目標(biāo)是錢,只要作案成本越來越高,他們就會(huì)逐漸放棄,或者轉(zhuǎn)移到其他更容易得手的目。所以,每一次平臺(tái)打擊都是在擠壓做號(hào)黨的生存空間。”丁丁說。
很少有人會(huì)注意到,企鵝號(hào)僅僅在2019年第一季度就攔截了黑產(chǎn)賬號(hào)注冊(cè)和登錄235萬次,攔截準(zhǔn)確率達(dá)到了99%。
聊完“下號(hào)”環(huán)節(jié)的攻防戰(zhàn),接下來做號(hào)集團(tuán)就該寫稿了。
丁丁的同事迪西給我發(fā)來一個(gè)文檔。
迪西是企鵝平臺(tái)內(nèi)容部門的,為了知己知彼,她日常會(huì)花時(shí)間去了解做號(hào)集團(tuán)的內(nèi)容生產(chǎn)模式,以試圖針對(duì)性地打壓。
我打開文檔,做號(hào)套路簡(jiǎn)直深似海。
翻到“偽原創(chuàng)的方法技巧”一章,里面詳細(xì)記錄著如何用“等價(jià)替換法”把炮制出一篇偽原創(chuàng):
“等價(jià)替換法又分為文字排序法、數(shù)字替換法、詞語(yǔ)替換法……”
這些方法不僅成體系,且分門別類,可操作性很強(qiáng),基本屬于義務(wù)教育水平以內(nèi)的人看完都能上手實(shí)操。
肉有五花三層,“文章搬運(yùn)大法”也分三六九等。
“初級(jí)搬運(yùn)”僅僅修改標(biāo)題和部分詞語(yǔ);“中級(jí)搬運(yùn)”會(huì)對(duì)標(biāo)題段落進(jìn)行重排;“高級(jí)搬運(yùn)”則會(huì)綜合多篇稿件內(nèi)容,來個(gè)“葫蘆娃大合體”;“終極搬運(yùn)”最厲害,不僅會(huì)把原文許多段落換個(gè)說法,還會(huì)將原文配圖也換成意思相近的其他圖片。
除了雇傭勞工手動(dòng)搬稿,規(guī)模稍大一些的洗稿團(tuán)伙大多已學(xué)會(huì)用科技的力量來武裝自己,全面步入工業(yè)化時(shí)代。
自動(dòng)化搬運(yùn)軟件也分為初、中、高、終級(jí)。
初級(jí)的軟件大多是一鍵直接搬運(yùn),特點(diǎn)是替代手動(dòng)操作,速度快效率高。
一般這類工具還提供“多平臺(tái)管理”,可以同時(shí)管理企鵝號(hào)、頭條號(hào)、百家號(hào)、大魚號(hào)等多個(gè)內(nèi)容平臺(tái)的賬號(hào)。
如果某個(gè)原創(chuàng)作者在 A 平臺(tái)發(fā)了篇文章,第二天剛打算發(fā)到 B平臺(tái),就發(fā)現(xiàn)已經(jīng)被人搶標(biāo)了原創(chuàng),那么很可能對(duì)方就是用這類搬運(yùn)工具打了時(shí)間差。
“中級(jí)搬運(yùn)軟件”開始進(jìn)入“半自動(dòng)輔助寫稿”時(shí)代。
在初級(jí)的基礎(chǔ)上,想洗哪篇文章就在軟件里輸入文章鏈接,它會(huì)從全網(wǎng)抓取所有相似文章,顯示出閱讀量、相似度、關(guān)鍵詞、詞頻統(tǒng)計(jì)(特定詞出現(xiàn)的頻率),并用不同顏色標(biāo)明好。
順著數(shù)據(jù)引導(dǎo),分分鐘改出一篇“優(yōu)秀”的偽原創(chuàng),既能避免被平臺(tái)判為抄襲,又能斬獲更多流量。
高級(jí)搬運(yùn)軟件已經(jīng)進(jìn)入“以機(jī)器為主,以人為輔”的工業(yè)自動(dòng)化生產(chǎn)時(shí)代。
在初、中級(jí)的基礎(chǔ)上,高級(jí)搬運(yùn)軟件實(shí)現(xiàn)抓取、識(shí)別、替換等整個(gè)流程的自動(dòng)化,人類唯一需要做的就是審核“機(jī)器寫的文章”,把邏輯不太通順的地方捋順。
某款針對(duì)企鵝號(hào)的做號(hào)軟件
“終極洗稿軟件”更厲害,全面帶領(lǐng)洗稿集團(tuán)全面走進(jìn) AI 時(shí)代,從搬運(yùn)到洗稿,再到檢測(cè)文章重合率,全部自動(dòng)完成。
具體就不展開聊,反正文檔中提到許多專業(yè)AI領(lǐng)域詞匯,什么NLP自然語(yǔ)言處理、結(jié)構(gòu)化信息抽取算法、語(yǔ)義聯(lián)想、情感分析、文本聚類、關(guān)鍵詞提取……
從展示的仿寫結(jié)果來看,也非常接近人類。
![]()
某AI仿寫軟件,點(diǎn)開圖片可看仿寫效果
用這些方法洗完稿發(fā)到各大平臺(tái),先甭管有沒有人看,讓下游負(fù)責(zé)灌流量的公司往里刷些閱讀量,什么"群控系統(tǒng)”那都是灰產(chǎn)團(tuán)伙標(biāo)配??傊朕k法干擾平臺(tái)的判斷,讓推薦算法誤以為文章是用戶愛看的,繼而得到更多推薦量。
![]()
傳說中的群控系統(tǒng),圖源自網(wǎng)絡(luò)
至此,你已經(jīng)清楚做號(hào)集團(tuán)的洗稿套路和工具了,現(xiàn)在要怎么對(duì)付他們?怎么在海量的文章中分辨出哪個(gè)是原創(chuàng),哪個(gè)是仿寫,哪個(gè)是二次創(chuàng)作,哪個(gè)是抄襲?鑒定標(biāo)準(zhǔn)是什么?如何防止誤傷?
這都是擺在迪西以及所有內(nèi)容平臺(tái)面前的難題。
迪西說,最初,平臺(tái)會(huì)為每一篇文章生成一個(gè)“MD5指紋”,如果比對(duì)指紋發(fā)現(xiàn)兩篇的指紋相同,則判定為“搬運(yùn)、抄襲”,給予打壓。
可后來,做號(hào)團(tuán)伙學(xué)會(huì)拆分文章和段落,學(xué)會(huì)替換同義詞、更改語(yǔ)序,洗稿技藝越來越精湛,以往那些反抄襲策略便逐漸失效。
我問迪西能不能同樣用 AI 技術(shù)來鑒別原創(chuàng),她說檢測(cè)侵權(quán)的技術(shù)正在不斷升級(jí),也有用到 AI相關(guān)技術(shù)。但她同時(shí)也反問我:“你覺得什么算是原創(chuàng)?”,我一下被問住了,心想是啊,如果連人類在原創(chuàng)、洗稿問題上都尚有爭(zhēng)議,沒有明確邊界,那訓(xùn)練出的 AI 又怎么能準(zhǔn)確鑒別?
這不僅是內(nèi)容平臺(tái)的困境,也是整個(gè)創(chuàng)作環(huán)境的困境。
同樣在互聯(lián)網(wǎng)、人工智能技術(shù)的加持下,復(fù)制粘貼、洗稿、搬運(yùn)、抄襲變得越來越容易,平臺(tái)卻越來越難反制。原因很簡(jiǎn)單,前者是把鹽和胡椒混在一起,后者卻要把二者分開,這注定是一場(chǎng)不公平的對(duì)弈。
但對(duì)于內(nèi)容平臺(tái)來說,這場(chǎng)仗再難也得打下去。我問迪西,那企鵝號(hào)打算怎么辦?
“慢慢來,情況會(huì)一點(diǎn)點(diǎn)好轉(zhuǎn)。”她告訴我,企鵝號(hào)目前在建立原創(chuàng)自動(dòng)維權(quán)機(jī)制,作者授權(quán)以后,企鵝號(hào)會(huì)在全網(wǎng)監(jiān)測(cè)侵權(quán)行為,并且主動(dòng)發(fā)起維權(quán)。
![]()
圖片截取自企鵝號(hào)后臺(tái)
很多原創(chuàng)作者感慨侵權(quán)易,維權(quán)難。把維權(quán)索賠機(jī)制建立起來,提高侵權(quán)者的風(fēng)險(xiǎn)成本,這倒是條不錯(cuò)的路子。
這是“堵”的一方面。“疏”的方面,企鵝號(hào)也會(huì)通過創(chuàng)建有版權(quán)的素材庫(kù)、版權(quán)二創(chuàng)開放平臺(tái)以及完善內(nèi)容服務(wù)商體系,幫助創(chuàng)作者提升原創(chuàng)能力。
“做號(hào)黨未來會(huì)消失嗎?平臺(tái)和黑產(chǎn)之間的戰(zhàn)斗會(huì)停止嗎?” 我問丁丁和迪西。他們都說不會(huì),這是一場(chǎng)無止盡的攻防對(duì)抗。
但我覺得會(huì)。在這件事上,我比較樂觀。
讓我們把鏡頭拉遠(yuǎn),會(huì)發(fā)現(xiàn)一件有意思的事,最近兩三年,騰訊、百度、字節(jié)跳動(dòng)等互聯(lián)網(wǎng)巨頭們正在打一場(chǎng)激烈的內(nèi)容“搶位戰(zhàn)”,所有人都往里砸錢都毫不含糊。
今日頭條說一年補(bǔ)貼個(gè)幾十億給原創(chuàng)作者;百度不服,下注100億連眼都不眨;騰訊差那幾個(gè)錢?100億是吧?再加十幾個(gè)億………
所有人僵持不下,這才給了做號(hào)集團(tuán)留出了生存時(shí)機(jī)。
這讓我腦補(bǔ)出一個(gè)很滑稽的畫面:槍戰(zhàn)電影里,一堆槍神用槍指相互著對(duì)方的頭,氣氛緊張,誰都不敢開槍也不敢撒手,此時(shí)幾個(gè)小蚊子嗡嗡飛過來,美滋滋把所有人吸了個(gè)遍。
其實(shí)大家都想把那破蚊子一巴掌拍個(gè)稀巴爛(這也不難),可是僵局里,誰顧得上那個(gè)蚊子呢?
回想一下,互聯(lián)網(wǎng)黑灰產(chǎn)的一次次出現(xiàn)的時(shí)機(jī),是不是都對(duì)應(yīng)著一場(chǎng)“鷸蚌相爭(zhēng)漁翁得利”的故事?
出行大戰(zhàn)那會(huì)兒,有人注冊(cè)一堆司機(jī)賬號(hào)蹭補(bǔ)貼,月入數(shù)萬;共享單車大戰(zhàn)那會(huì)兒,有人用面包車載著單車來回兜風(fēng)領(lǐng)紅包,月入數(shù)萬;外賣平臺(tái)大戰(zhàn)那會(huì)兒,有人刷空訂單騙補(bǔ)貼,又月入過萬。
劇情都差不多:風(fēng)口出現(xiàn),巨頭搶位,砸錢補(bǔ)貼,黑(灰)產(chǎn)進(jìn)場(chǎng),喜提羊毛。
所幸,如今“內(nèi)容大戰(zhàn)”僵局持續(xù)了好幾年,已經(jīng)逐漸被網(wǎng)信辦約談、用戶吐槽、媒體質(zhì)疑等諸多因素打破,大家都開始放下手槍全力先拍死身上的那只“蚊子”。
迪西說,目前企鵝號(hào)正在調(diào)低部分內(nèi)容的收益系數(shù),放棄掉一些流量型KPI,把“全品類內(nèi)容”作為主要工作目標(biāo),包括引入各個(gè)領(lǐng)域頭部的優(yōu)質(zhì)賬號(hào),給予政策上的傾斜,并且籌備原創(chuàng)專家委員會(huì),建立一套完整的原創(chuàng)權(quán)益審核、監(jiān)督、處罰流程,擠壓掉做號(hào)集團(tuán)的營(yíng)收空間,優(yōu)化企鵝號(hào)原創(chuàng)生態(tài)。
再看看今日頭條、百家號(hào),其實(shí)也在陸續(xù)實(shí)施類似的計(jì)劃。
內(nèi)容平臺(tái)和做號(hào)黨還會(huì)經(jīng)歷一個(gè)博弈的過程,但邪不壓終究是亙古不變的真理。
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論
把提取報(bào)酬的時(shí)間拉長(zhǎng)呀,時(shí)間也是成本,對(duì)于真正的原創(chuàng)作者來說,這個(gè)反到并不是成本了。