|
百度推廣審核機制是什么?有幾層?前不久,百度公開數據屏蔽3.8億條虛假有害鏈接,處理超過1億個違規(guī)站點,在2014至2015年兩年時間里拒絕了5億條推廣信息,2015年拒絕438300個不良賬戶。 百度經常被質疑,搜索結果中存在虛假推廣信息,夸大宣傳等問題,不少人認為只要有錢就能在百度上做推廣,誰出價高就能排在搜索結果的第一位。而百度推廣確實存在各種問題,如同阿里平臺中始終有假貨存在,在這方面百度責無旁貸。但在道德審判之外,我更為關心具體的場景細節(jié),到底百度需要面臨怎樣的“騙子橫行”?以及夾在“騙子”與“需求”之間的百度在其中究竟做了什么?每個硬幣都有一體兩面,本文希望能夠通過純粹的技術視角來重新看百度的另一面。 事件回放 此前,一位前百度高管找到李彥宏,為一家著名投資機構旗下的P2P公司說情,希望加入到能夠在百度進行推廣的“P2P網貸平臺白名單”。而說情的原因是因為這家P2P公司的資質未能達到百度信譽的評定標準,并被百度拒絕推廣請求,雖然這家P2P公司也獲得了正規(guī)知名機構的風險投資,并且這位前高管在百度內部有著很多“人脈資源”甚至有直接上達李彥宏的權力,但百度方面依然表示需要按照百度的信譽V體系來審核,并且最終仍然沒有通過審核。 除此之外,事實上百度還做了大量反詐騙的工作,“網民權益保障計劃”網站中,百度就對部分詐騙網站進行了曝光。 而這些反詐騙案例得以曝光,都與“百度信譽V體系”有關,如同阿里打假的“神盾局”,“百度信譽V體系”也是百度的防火墻,為什么李彥宏如此信任這道防火墻,甚至可以直接拒絕前高管的請求? 百度信譽V體系,三道防火墻 簡單的說百度信譽V體系就是對企業(yè)信譽的評級,百度首先通過這套評級機制來決定企業(yè)是否有資格在百度進行推廣,并且即使已經入住的企業(yè),“百度信譽V體系”依然會對其進行持續(xù)性的監(jiān)督,中途一旦發(fā)現違規(guī)就根據具體情況進行暫停推廣、警告、永久封號、上報公安等等具體措施。 信譽V體系主要依托人工與大數據的混合監(jiān)控,在數據審查主要分為三層遞進方式,可以看成是三道防火墻。 1)第一道防火墻,百度沒有該企業(yè)數據,要求資質信息 沒有任何一家企業(yè)可以隨意在百度投放推廣信息,根據每個行業(yè)的審核機制不同,百度會要求提供每個行業(yè)的企業(yè)背景資料和相關證件,包括公司營業(yè)執(zhí)照原件及營業(yè)執(zhí)照上登記的法定代表人的身份證原件的影印件,以及法定代表人手持自己身份證的肖像照片等等。 百度通過“實名認證、資信認證、商標認證、授權認證、官網認證、誠企專區(qū)”等六大產品徹底核實企業(yè)身份信息的真實性。 基本的企業(yè)信息審核,這是第一道防火墻。 2)第二道,百度擁有部分該企業(yè)數據,全網信用建模 只是獲得企業(yè)的給到的信息是遠遠不夠的,這等于博弈的籌碼完全在對方手里,而百度方面也需要自己的籌碼,也就是對方的數據信息。百度主要采取了以下數據收集的方式對該企業(yè)進行全網的信用建模。 接入政府方面的第三方數據,通過接入工商信息數據、全國個人身份信息數據等等相關部門數據,通過人工審查,實現100%的信息準確性核實,進而規(guī)避部分地區(qū)工商網站建設落后導致的人工審核受限、無企業(yè)信息可查的問題。其次是通過政府方面的監(jiān)管記錄可以對企業(yè)進行更嚴密的監(jiān)控,下圖以“蘇寧”為例。 百度的此類相關數據均來自政府監(jiān)管。 其次通過全網數據對其進行建模,百度有著可以對“事件”建模的技術,例如我們搜索“張飛”時百度可以根據全網的數據,找出一切與張飛的關聯人物,諸如趙云、劉備等等,如圖。 因此我們繼續(xù)以“蘇寧”舉列,百度會根據“蘇寧”這個關鍵詞索引一切關聯的大數據、諸如“天貓”、"京東"、"家電"、"家電"等等關鍵詞,進行一個大的品牌建模。其中百度會抽取大數據中的諸如“蘇寧電器質量怎么樣?”、“蘇寧發(fā)貨速度好快”等等全網的相關鍵詞搜索信息、媒體網站輿論信息、問答網站信息、百度口碑信息等等多方信息,對其進行一個信譽體系的建模,反向得出其信譽指數。 也就是說,想要在百度進行推廣的企業(yè),在其入駐百度之前,百度就已經有了其相關的大量數據信息,從政府方面提供的信息再到全網的信譽初級指數,凡是能夠有該企業(yè)數據的地方百度都會不遺余力的去收集。 因此,即使一個網站給了百度初級的資質信息,但只要無法與百度取的的政府信息匹配,以及有著不良的全網信息記錄評級,就不可能被允許投放推廣信息。在這套系統(tǒng)制約下,百度信譽認證體系已封禁企業(yè)達20546家,共封禁194392個推廣賬戶。 3)第三道防火墻,持續(xù)監(jiān)督該企業(yè)數據,全網追蹤跟進+百度口碑 推廣信息動態(tài)監(jiān)控,上面兩道防火墻都是建立在投放推廣信息之前,而讓百度最為頭疼的則是在投放推廣信息之后,大部分作惡的企業(yè)都是在百度審核之時交給了百度一個正常的網頁,而在百度通過審核之后便通過代碼技術,偷偷換上自己的非法內容,瞞天過海,在百度那里原來看到的“正常內容”,到了用戶那里就變成了“作惡內容”。 舉個例子,一些不法推廣公司會在Flash推廣信息中嵌入第三方外鏈或php腳本內容,會根據IP、時段、設備的不同進行不同的跳轉,并且還會監(jiān)視百度蜘蛛的抓取技術躲避百度監(jiān)控,早上同一個鏈接點開可能是正常的鋼材推廣信息,但是到了晚上就變成了色情內容,而百度面通過建立程序員組建立Flash信息的代碼解析模塊,24小時監(jiān)控,主動發(fā)現其中“不應出現”的外鏈或php腳本內容。 經過這么多年的“交手”,百度目前基本已經杜絕推廣信息作弊。去年百度共封禁Flash賬戶超1.5萬個,涉及Flash信息數超570萬條,其中機器拒絕違規(guī)Flash信息通過共近60萬條。 全網數據動態(tài)監(jiān)控,“百度信譽V”體系并非永久不變,對于百度來說除了在企業(yè)主推廣之前對其進行全網建模以外,還會持續(xù)跟進對其信譽的評級,一旦在權威媒體網站或者在關鍵詞搜索中檢索到其負面內容,或者檢測到政府方面對該企業(yè)給予了處罰內容,那么企業(yè)信譽則會發(fā)生相應波動,而當波動幅度過大時,百度方面會立即進行人工檢查,并可能立即停止其推廣行為。 百度口碑,該項目是百度內部自建項目,通過利用百度用戶的UGC內容對各大網站內容進行用戶評級,這也是“百度信譽V”體系中的一環(huán)。目前百度口碑中集成了評論、實名曝光、輿情觀察等內容。用戶的海量曝光投訴,對“百度信譽V”有著較大的參考價值,以下為百度口碑的實名曝光。 一些思考 闌夕曾在《百度為什么要“賣”貼吧》一文中說過,由于國外有著極強的政府監(jiān)管以及優(yōu)渥的基礎設施,因此谷歌在投放推廣信息方面并沒有太多后顧之憂,與政府有著涇渭分明的界限。 由于國內的監(jiān)管機制、基礎設施都起步較晚,導致原本屬于政府的壓力都轉嫁到了互聯網公司上,而一旦互聯網公司監(jiān)管不利,公眾對互聯網公司的憤怒反而大于對政府的憤怒,這里面或許有多少無奈。 此外,在當前的環(huán)境下,無論百度阿里騰訊都無法徹底禁止“作惡者”,百度眼皮底下依然會有想要鉆空子的作惡者,阿里的平臺上也無法做到完全禁止假貨,而那些以微商之名做“傳銷”的假微商,也還是會對微信不擇手段的利用。 但值得期待的另一面則是,互聯網公司正在承擔起這些責任,百度成立了“百度信譽V”,拒絕了5億的推廣頻次,自掏近5000萬的理賠費,阿里成立了“神盾局”,一年花費10億用于打假,騰訊也在通過監(jiān)測關鍵詞禁止一切非法推廣等等。 而這些公司處理的方式都有一個最大的共同點就是—技術,而技術只對結果負責,所有一切“作惡”都會被徹底放到放大鏡底下被監(jiān)視,脫離于原來的“人治監(jiān)控”手段,也就可以避免各種因人而導致的不確定的利益勾結。 因此對于未來,當我們拿起放大鏡去客觀看每一個歷史進程的細節(jié)時,那個真實的世界,一直都在變得更好。 奇蟻科技是一家專注泰安網站建設、營銷型網站、商城網站、O2O網站、網站SEO優(yōu)化、微信應用開發(fā)、APP軟件開發(fā)、手游開發(fā)、全景圖像的高科技企業(yè),公司定位于泰安中小企業(yè)互聯網提供商,旨在“創(chuàng)建能為企業(yè)帶去訂單的網站”,為客戶提供全面的互聯網營銷方案,幫助企業(yè)實現轉型,讓生意不再難做。 泰安網站建設,泰安網站制作,泰安做網站,泰安企業(yè)網站設計,泰安網絡公司,泰安微信小程序 電話:18605387375 地址:泰山大街利得摩爾商貿城3樓3129 ——泰安奇蟻科技 |