我國首部規(guī)范互聯(lián)網(wǎng)信息環(huán)境的基礎(chǔ)法規(guī)《網(wǎng)絡(luò)安適法》在6月1日之后正式實(shí)施。
該法實(shí)施前,各大互聯(lián)網(wǎng)巨頭就紛紛加碼信息安適及內(nèi)容自查等方面的投入,阿里和騰訊別離通過各自的云辦事輸出其安適技術(shù)接口,或強(qiáng)制推行實(shí)名制。百度先后發(fā)布公告實(shí)行百度賬號實(shí)名制、百度網(wǎng)盤自6月1日起也要求實(shí)名制,百度在安適方面,早就推出了大數(shù)據(jù)平臺(tái)4A安適體系;以個(gè)人安適業(yè)務(wù)起家的360也有完善的大數(shù)據(jù)安適平臺(tái)。
在新法實(shí)施同一天,今日頭條頒布頒發(fā)成立“網(wǎng)絡(luò)安適委員會(huì)”。
鈦媒體獲悉,該委員會(huì)是一個(gè)獨(dú)立組織,由技術(shù)、運(yùn)營、審核多部門的核心人才共同參與,從注冊實(shí)名制、社區(qū)自律以及審核等方面,保障用戶安適和內(nèi)容。
不生產(chǎn)內(nèi)容、專注于內(nèi)容分發(fā)的今日頭條,躋身國內(nèi)內(nèi)容分發(fā)平臺(tái)第一陣營,尤其是在2015年9月這家公司推出頭條號以來,頭條號的數(shù)量迅速增長,從用戶規(guī)模到內(nèi)容體量,這都要求在平臺(tái)運(yùn)營規(guī)則上進(jìn)一步規(guī)范化。
對于內(nèi)容分發(fā)平臺(tái)而言,網(wǎng)絡(luò)安適最主要的議題是內(nèi)容安適。以坐擁上億用戶的微信公眾平臺(tái)就曾在產(chǎn)品上經(jīng)歷過無數(shù)次迭代,在內(nèi)容過濾、賬號封禁、用戶舉報(bào)機(jī)制上做足了功夫。今日頭條抽調(diào)了 20 余人的技術(shù)團(tuán)隊(duì),專門匹配給網(wǎng)絡(luò)安適委員會(huì),顯然,在網(wǎng)絡(luò)安適建設(shè)方面依然是一個(gè)技術(shù)升級的信仰者。
近日,今日頭條首度向鈦媒體透露了其在網(wǎng)絡(luò)安適和內(nèi)容審核上的獨(dú)家“法寶”。作為“幕后英雄”的網(wǎng)絡(luò)安適委員會(huì),到底是如何運(yùn)作的?算法模型、人工智能,到底是怎么幫手人工完成安適審核?
一、實(shí)名制升級:接入face++識(shí)別技術(shù)
有自媒體從業(yè)者曾向鈦媒體證實(shí),頭條號開放平臺(tái)的注冊極為嚴(yán)格。在賬號注冊上,根據(jù)相關(guān)政策要求用戶注冊必需綁定手機(jī),并且堅(jiān)持人工審核。
2017年,新成立的網(wǎng)絡(luò)安適委員會(huì)對實(shí)名制進(jìn)行了一次技術(shù)升級,即通過AI技術(shù)對注冊用戶進(jìn)行身份實(shí)名認(rèn)證,這項(xiàng)識(shí)別辦事采用了曠視科技(face++)提供的人臉識(shí)別、活體檢測技術(shù),來判斷每一位實(shí)名用戶各項(xiàng)信息的匹配程度。
鈦媒體記者在本年3月份頭條號發(fā)布的一則“嚴(yán)厲打擊發(fā)布不實(shí)負(fù)面信息的公告”中看到(如下圖),一共20個(gè)頭條號遭遇禁言處罰,并有3名頭條號運(yùn)營者被封禁。
注冊頭條號的用戶,首先都將要求閱讀并接受一份《頭條號辦理制度》,于頭條號名稱規(guī)范、簡介規(guī)范、審核尺度、處罰尺度等都做出了明確規(guī)定。
由于每個(gè)身份證僅限注冊一個(gè)頭條號,與其他平臺(tái)比擬,頭條號的審核規(guī)則是最嚴(yán)格的。一旦因運(yùn)營者違規(guī)操作被平臺(tái)封禁賬號,“被封禁賬號的身份證也不予釋放”,這也意味著,嚴(yán)重的違規(guī)操作者可能面臨永久加入“黑名單”的風(fēng)險(xiǎn)。
二、審核機(jī)制:如何“干掉”虛假信息
在內(nèi)容審核方面,各大內(nèi)容型平臺(tái)歷來都是高成本、高投入,內(nèi)容把關(guān)的技術(shù)能力,對于內(nèi)容型平臺(tái)來說更是一條生死線。鈦媒體對國內(nèi)某第一陣營直播平臺(tái)的采訪中發(fā)現(xiàn),內(nèi)容運(yùn)營的人力成本、技術(shù)和設(shè)備采購成本加在一起,一個(gè)典型的內(nèi)容型平臺(tái)在內(nèi)容自查上的投入要超過一個(gè)億人民幣。
低俗、謠言、標(biāo)題黨——堪稱國表里各個(gè)內(nèi)容平臺(tái)的三大毒瘤。
針對于此,今日頭條在內(nèi)容審核上采取了一套獨(dú)家的“四審機(jī)制”,也就是說,在今日頭條的內(nèi)容審核流程中,文章100%過人工審核,通過“人防”和”技防“的結(jié)合,所有文章通過技術(shù)過濾、人工審核、盲審、復(fù)審的“四審機(jī)制”才能發(fā)布。
“盲審”環(huán)節(jié),充分表現(xiàn)了機(jī)器+人工審核的優(yōu)勢:機(jī)器按照規(guī)則和比例抽取文章,將同一篇文章同時(shí)分配給兩位審核員,如果兩人判斷一致則通過,判斷紛歧致會(huì)再分配給第三個(gè)人進(jìn)行把關(guān),通過這種模式最大程度降低了因?qū)徍藛T主不雅觀原因、個(gè)人問題造成的誤放、漏放。
那么,最為頭疼并且隱蔽的標(biāo)題黨,又是怎樣攔截的呢?今日頭條技術(shù)負(fù)責(zé)人向鈦媒體介紹,“標(biāo)題黨可以通過人工+機(jī)器三層攔截,進(jìn)行識(shí)別。”
今日頭條研發(fā)團(tuán)隊(duì)建立的數(shù)據(jù)模型,目前可以準(zhǔn)確識(shí)別出“標(biāo)題黨”的內(nèi)容。一篇完整的文章進(jìn)入平臺(tái)機(jī)器經(jīng)識(shí)別和處理,最終從“機(jī)器”流程中放出來,今日頭條的技術(shù)負(fù)責(zé)人向鈦媒體還原出了一個(gè)完整的識(shí)別過程:
當(dāng)平臺(tái)識(shí)別出標(biāo)題黨的關(guān)鍵詞后,“發(fā)送彈窗”的方式提示并勸導(dǎo)作者打住這樣的行為;通過模型識(shí)別而來的標(biāo)題黨,平臺(tái)將召回并人工確認(rèn);最后一道工序交給人工——人工復(fù)審將對從各種渠道召回的文章進(jìn)行最終的人工評估復(fù)審。