從百度貼吧過濾詞分析中國對網絡言論的規管

2011-01-13





  百度貼吧依託百度的中文搜索功能,以其便捷易用、開放度高聚集了大量用戶,經過近7年的發展已經成為最大的中文交流社區。與中國的其他網站一樣,百度貼吧對用戶的發文操作進行過濾審核,以此監控用戶的言論。貼吧設置有過濾機制,採用過濾詞把關發貼過程。本文對過濾詞進行歸類,發現貼吧過濾的內容範圍較大,涵蓋了政治類、突發事件類、不良信息類以及邪教、軍事等方面。對於網絡言論規管,本文認為中國應該借鑒國外經驗,增加過濾透明度,加強從業者自我約束,制定具備可操作性的規範,明確法律規管條文。

百度貼吧及其發展   
  百度貼吧於2003年11月推出,「是一種基於關鍵詞的主題交流社區」。2003年11月25日,一個題為「百度將升級搜索引擎,具備開放共享的功能」的貼子在貼吧的搜索引擎吧發表,百度貼吧開始試運行。同年12月,百度貼吧正式投入使用。2004年第一個「超級女聲吧」創建,此後多個超女吧相繼創建;次年8月份隨著賽事白熱化,貼吧流量也相應激增,超女前三甲的貼吧發貼量超過1000萬。經過7年的發展,百度貼吧現有20多萬個貼吧,每天的活躍用戶數在2000萬左右,日均流量達2.5億人次。   

  百度貼吧裏,每個主題貼吧以一個關鍵詞作為討論主題,各個貼吧類似於是每個關鍵詞的小型論壇。用戶可以通過搜索關鍵詞找到或創建相關主題的貼吧,發佈、尋找信息和資料,認識共同的興趣愛好者。   

  貼吧的使用方法並不複雜。對於普通用戶來說,在貼吧首頁的搜索框中輸入關鍵詞,貼吧的默認選擇是「進入貼吧」,點擊「百度一下」,就立即可以進入到與搜索關鍵詞一致的主題貼吧中。如果該關鍵詞的主題貼吧存在,可以立即參與討論;如果不存在,可以申請創建貼吧。如果用戶想管理某個貼吧,則可發出申請,經系統審核通過就可成為吧主,可以對貼子進行置頂、編輯、刪除等操作,甚至封禁用戶和IP。

  除了一些有設置權限的貼吧和俱樂部外,一般的貼吧均可供任何用戶以遊客身份瀏覽、發表、回覆貼子,無需註冊、登錄;有的貼吧會根據吧主的意願決定是否允許用戶匿名發貼。但2010年11月18日,貼吧開發團隊發出公告,在全部貼吧實行登錄發貼,用匿名發貼代替遊客身份發貼留言。   

  百度貼吧最大的特點在於,結合百度搜索技術,完全由用戶驅動,用戶自由創立、自主管理貼吧,達到分享交流的目的。   

  貼吧作為百度中文搜索技術的衍生產品,其準確度和便利性得益於成熟的搜索技術而大大增強,貼吧的主題可以準確快速被搜索到。   

  百度貼吧官方首頁顯示,貼吧主題按內容共分為明星人物、動漫、影視等17大類常駐目錄,根據時事熱點會臨時推出相關貼吧,比如2010年4月14日玉樹地震發生後,貼吧新增玉樹地震條目;下有170小類,共90783個貼吧。這意味著用戶將有9多萬個主題可以參與討論,而普通論壇是無法形成如此大的規模的。

百度貼吧過濾詞的應用情況   
  為了管理和限制用戶發貼,使貼吧貼子內容更符合中國互聯網法律法規的規定,發貼需要經過百度的過濾系統的審核和人工審核。   

  百度貼吧協議從貼吧用戶的權利義務、權利歸屬、處罰規則三個方面對貼吧用戶進行規範。協議第二章「貼吧用戶」中聲明用戶享有言論自由的權利;緊接著規定了12個類別,聲明不准含有任一類別信息的貼子出現。如有用戶涉及發佈含有禁止信息的貼子,貼吧將按協議第四章「處罰規則」處理,用戶有可能會被刪貼、關閉部分權限,甚至帳號被停用或被刪除。但協議中並沒有明確表示會用什麼方式對禁止的內容進行審查,也沒有詳細說明哪些字詞會違規。據百度貼吧總經理稱,百度貼吧每天刪貼達100萬,主要是刪除廣告貼。   

  實際操作時,貼吧通過設置過濾詞和人工審核作為審核貼子的手段,其中過濾詞審核對於貼子的事先審核非常有效。貼吧過濾詞以兩種方式出現,一種是發貼時對貼子內容進行的過濾動作,另外一種是過濾詞無法成為貼吧的討論主題。前一種方式中,用戶發表的貼子內容一旦與事先設置的過濾詞匹配得上,貼子的發表操作將被迫中斷,出現貼子無法發表的情況,網頁提示:「請不要發表含有不適當內容的留言」或者「請不要發表廣告貼。」後一種方式則會出現「抱歉,根據相關法律法規和政策,本吧暫不開放」或者「貼吧不存在」或者只能瀏覽不能發貼的情況。

百度貼吧過濾詞分類   
  百度貼吧過濾詞數量眾多,每過一段時間貼吧系統管理者就會更新過濾詞,而且貼吧沒有公佈這些過濾詞。因此本文無法把所有的過濾詞羅列出來加以統計。本文將借助「百度貼吧和諧測試器」進行過濾詞測試,歸納過濾詞的類別,總結貼吧對貼子哪些方面的內容有所限制。

1. 政治類   
  政治類內容是中國網絡言論中相當敏感的內容之一,中國特殊的體制和國情是造成這種現象的主要因素。中國的網絡監管嚴格監控此類內容,因此網站管理者也會對此類詞語把關,在百度貼吧的過濾詞中,政治類過濾詞佔的比例很大。   

  本文將貼吧的政治類過濾詞分為五個小類(表4-1),包括分裂類、煽動仇恨類、反動類、歷史事件類、人物類,其中除了分裂類和煽動仇恨類能找到相關的法律依據外,另外三類都沒有說明會遭到過濾的緣由。   

  反動類過濾詞主要是指質疑當前中國體制,批評、反對現今政治情況的一類詞語,有危及到政權的嫌疑。貼吧對明顯提及民主和共產黨的相關詞語進行過濾。由於2010年諾貝爾和平獎頒給因煽動顛覆國家政權罪而服刑的「異見人士」劉曉波,有關其一切言論和消息的發佈監控較為嚴格。

2. 突發事件類   
  突發事件類過濾詞指新近發生的消息或新聞中出現的重大的事件,這些事件容易引起網絡用戶的關注,經過用戶的「包裝」後,其相應的詞語紛紛出現。這些事件經常涉及民生問題並牽涉到政府部門,用戶會以此批評社會不公現象和政府的處理不當,在網絡上有一呼百應的力量,容易引起不安的情緒,可能影響社會安定,因此這類詞語屬於貼吧過濾對象。而另一方面,因為突發事件具有時效性,在事件發生的時期內是重點過濾對象,一旦事件告一段落,貼吧將解除部分事件相關詞語的過濾。   

  本文將突發事件類過濾詞分為社會、動亂、罪案、自殺、災難等五類(表4-2)。

3. 不良信息類  
  網絡上的不良信息是網絡規管的難點之一,不僅數量多,且呈多元化,除了包含有暴力、色情類等「低俗內容」外,還存在賭博、毒品、非法交易等信息,既違反法律又違反道德。《互聯網信息服務管理辦法》中明確禁止互聯網傳播涉及暴力、色情、賭博、毒品等不良信息。根據這一規定,貼吧對不良信息類的詞語進行審核過濾。   

  本文把不良信息類過濾詞分為五類,分別是暴力類、色情類、賭博類、毒品類、非法交易類(表4-3)。

4. 其他類別  
  除了前文提到的政治類、突發事件類、不良信息類,還有一些過濾詞同樣值得注意。本文將這些過濾詞歸類為邪教類、新聞媒體類、軍事洩密類、轉換類(表4-4)。其中,替換類過濾詞是指用戶為了規避過濾系統審查,通過諧音、拼音、英文等方法用來替換掉原本漢字描述的詞語。不過,貼吧過濾系統更新頻繁,將此類用來替換的詞語也加入過濾詞隊列中。

過濾機制的地位和副作用
  截至2009年底,中國用戶規模達到3.84億人,互聯網普及率為28.9%。中國網絡相當於一個擁有3.82億人的虛擬社會。   

  過濾機制以技術手段省去大量人工規管工作,並且在不良信息和言論開始傳播之前就將其攔截過濾,效率高而且具有事先防範功能,是中國網絡言論規管的有效手段。   

  過濾機制是國家管理互聯網的有力工具,然而過濾機制的使用過程中各種對其爭議的聲音不絕於耳,尤其公眾十分警惕過濾機制侵犯了言論自由。相對其他國家而言,中國的過濾機制更為嚴格,在方便規管網絡言論的同時也帶來不少的負面影響,例如:繁多的過濾詞設置使得網絡使用效率降低,容易發生「誤殺」情況、過濾詞信息不透明不公開、過濾詞繁多,用戶有興趣討論的話題受到限制、封鎖過多的網頁,限制了用戶獲取信息的權利等。
下載
相關文章 / Related Articles

「中國式公關」

劉書賢
2021-03-31

香港學生反修例運動中網絡關係解體的實證調查

宋昭勛、吳靜、胡欣立
2021-01-11

中國傳媒上的「奉勸」

錢鋼
2020-05-15