傳媒每日每時提供事實、評論、形形色色的實用信息。如果將這些觸目可得的東西稱之為「顯信息」,那麼,傳媒上還有「潛信息」。例如,要問「三十年來中國政治體制改革進展如何?」下圖會將不易看清的潛隱事實「顯影」示人。
這張圖,顯示「政治體制改革」一詞在中共中央機關報《人民日報》上的歷年被使用篇數。圖上的漲跌曲線也和我們的切身經驗相吻合:政改在上世紀八十年代出現高潮,一九八九年後戛然而止。最近十多年,起起伏伏,雖有微瀾,但政改的熱度和二十年前完全不可比擬。
用信息檢索分析傳媒話語
香港大學新聞及傳媒研究中心的中國傳媒研究計畫(CMP)近年來一直在探討一種研究方法。我們稱其為「基於互聯網平臺,運用信息檢索技術的傳媒話語分析」。
人類的諸多秘密潛藏在話語之中。「社會政治權勢和意識可以通過話語來維持、認可和再生」(馮.戴伊克:《話語.心理.社會》。思潮的漲落,集體無意識的爆發或者迷失,在話語中皆有蹤跡可察。一個個潛藏巨大能量的口號,是怎麼降臨的?在語言的「華爾街」,不同語詞走出了什麼樣的升降曲線?傳媒如何參與制造了話語的波瀾起伏︱又被這種起伏所裹挾漂流?
新聞媒介上的話語,保存最為完整、最易於檢索計量。傳媒話語分析從符號學發展而來。西方學者開創了這一理論,但他們開始從事新聞話語研究的時候,還沒有互聯網和搜索引擎,甚至,還沒有個人電腦。
大約在一九九二年,我聽說有人在用電腦分析整本《紅樓夢》的語言特色,頗覺驚異。後來知道,那時中國已經開始研究「機器翻譯」課題,一項名叫「信息檢索」的技術應運而生。在香港,著名學者金觀濤和劉青峰夫婦,建立了清末民初文獻資料庫,首創使用電腦檢索系統的「計量歷史學」方法。
這一時期美國出現了搜索引擎。一九九零年出現了搜索引擎的鼻祖Archie,此後, WebCrawler、Lycos、Infoseek、Alta Vista、Inktomi、Northernlight......,一個又一個互聯網搜索引擎誕生,直到Google、Baidu風靡世界和中國。
沒有電腦,不可能有電子信息檢索。沒有網絡,不可能有海量信息檢索與計量。而互聯網的飛速發展,預示了網絡信息檢索與處理的誘人前景。人們不僅可以在瞬間搜索到所需要的信息,而且可以限定時間、空間(報紙、網站等信息提供者),設定各種邏輯關係,有針對性地搜索和精確計量;不僅可以搜索、計量文字信息,而且可以搜索、計量圖片、聲音和視頻信息;不僅可以搜索、計量傳統意義的「大內容」(Macro-contents),而且可以搜索、計量隨著Web 2.0而興盛的「微內容」(Micro-contents)。
我們現在可以方便地對一份報紙的全部歷史資料進行檢索,也可以方便地對幾百種報紙同時進行檢索。我們的鑰匙就是關鍵詞。每次檢索,電腦會給我們一個結果:某一關鍵詞的被使用篇數。這個結果如同人的體溫、江河水位、股票價格,是寶貴的研究依據。當然,電腦不會告訴你哪些詞應該被檢索;這完全要依賴我們對傳媒的持久觀察和經驗性研究。
從關鍵詞的破譯看大局態勢
我們要研究傳媒上各個關鍵詞的「語源」、「語境」、「語義」和「語義流變」。這種傳統的語言學方法,和基於互聯網平臺的檢索手段結合,使我們可以勾勒出更宏觀也更準確的圖像:傳媒在說什麼?什麼人在說?不同人(不同傳媒)所說的有何異同?在不同的時間,所說的又有什麼不一樣?
更具挑戰性的是對檢索結果的「破譯」:從紛繁的語言現象中,看出語言「棋盤」各個「棋子」的關係,看出錯綜的關係如何位移,識別偌大棋局的總體態勢。
運用這個方法,二零零一年,我曾檢索研究《解放軍報》,論證文化大革命從醞釀到爆發的過程,也是有關階級鬥爭、個人崇拜、扼制人性等紅色口號的勃興過程;二零零三年,我檢索研究了「輿論導向」、「輿論監督」、「新聞改革」和「新聞自由」四個關鍵詞的表現和相互關聯,指出中國新聞改革依然受到黨的嚴格控制,爭取新聞自由的道路艱難坎坷;二零零六年是唐山地震三十周年,我對中國大陸有關唐山地震的報導做了內容分析和話語分析,發現中國傳媒正在出現「靜悄悄的裂變」,新聞界奮力突破管制,呼喚人性和公民權利的民間話語在迅速生長。二零零七年,我的研究重點是政治改革。
在中國大陸,有六個詞是「政治體制改革」重要的相關詞。其中「民主政治」、「政治文明」和「黨內民主」屬官方話語,見諸于領導人講話、黨的檔、黨的媒體。而「憲政」、「公民權利」、「公民社會」則是民間話語,知識份子和追求自由的報紙用得較多。無疑,後者顯示的政改訴求更加切中要害。
目前官方話語的總體傳播強度高於民間話語。使用「慧科搜索」檢索二零零四年到二零零七年的中國報紙,我發現:多數使用「政治文明」或「民主政治」或「黨內民主」的文字,未使用民間話語中的任意一詞。而大多數使用「憲政」或「公民權利」或「公民社會」的文字,未使用官方話語中的任意一詞。同時使用兩者的文字,比重很低。
中共中央總書記胡錦濤在十七大的政治報告,使用了上述官方話語的三個詞,沒有使用民間話語的三個詞。這也可以證明,有關政治體制改革的兩種話語,確有明顯的分野。可以假設:未來五到十年,如果民間話語的比重漸大,官、民兩種話語的重合日多,那意味著什麼?意味著,中國政改將有較大的進展。你也可以想像相反的情形。
十七大召開前後,我在CMP網站(http://cmp.hku.hk)發表了十七篇文章,對中國傳媒上的「政治體制改革」話語作了詳細分析。正是這一分析,使我們對中國政治體制改革的現狀和前景持謹慎冷靜的態度:有期望,沒有奢望。我們看到政治改革的能量在積聚,也看到曾導致胡耀邦和趙紫陽兩任總書記下臺的紅色鐐銬︱「四項基本原則」,依然鎖著政治家們的雙腳。
一個面對中國傳媒和中國政治的傳媒話語觀測系統,正在逐步成型。這個系統可以幫助我們研究中國政治的轉型和中國傳媒的演變,也可以幫助我們研究中國社會的新陳代謝。目前各種搜索引擎已經開始建立對博客的搜索,假以時日,對不同關鍵詞在博客的傳播表現,將可以如報刊文本一樣被準確計量。這意味著,傳媒話語觀測系統還可以觀測千姿百態的民間輿論,解析輿情漲落的奧秘。
這張圖,顯示「政治體制改革」一詞在中共中央機關報《人民日報》上的歷年被使用篇數。圖上的漲跌曲線也和我們的切身經驗相吻合:政改在上世紀八十年代出現高潮,一九八九年後戛然而止。最近十多年,起起伏伏,雖有微瀾,但政改的熱度和二十年前完全不可比擬。
用信息檢索分析傳媒話語
香港大學新聞及傳媒研究中心的中國傳媒研究計畫(CMP)近年來一直在探討一種研究方法。我們稱其為「基於互聯網平臺,運用信息檢索技術的傳媒話語分析」。
人類的諸多秘密潛藏在話語之中。「社會政治權勢和意識可以通過話語來維持、認可和再生」(馮.戴伊克:《話語.心理.社會》。思潮的漲落,集體無意識的爆發或者迷失,在話語中皆有蹤跡可察。一個個潛藏巨大能量的口號,是怎麼降臨的?在語言的「華爾街」,不同語詞走出了什麼樣的升降曲線?傳媒如何參與制造了話語的波瀾起伏︱又被這種起伏所裹挾漂流?
新聞媒介上的話語,保存最為完整、最易於檢索計量。傳媒話語分析從符號學發展而來。西方學者開創了這一理論,但他們開始從事新聞話語研究的時候,還沒有互聯網和搜索引擎,甚至,還沒有個人電腦。
大約在一九九二年,我聽說有人在用電腦分析整本《紅樓夢》的語言特色,頗覺驚異。後來知道,那時中國已經開始研究「機器翻譯」課題,一項名叫「信息檢索」的技術應運而生。在香港,著名學者金觀濤和劉青峰夫婦,建立了清末民初文獻資料庫,首創使用電腦檢索系統的「計量歷史學」方法。
這一時期美國出現了搜索引擎。一九九零年出現了搜索引擎的鼻祖Archie,此後, WebCrawler、Lycos、Infoseek、Alta Vista、Inktomi、Northernlight......,一個又一個互聯網搜索引擎誕生,直到Google、Baidu風靡世界和中國。
沒有電腦,不可能有電子信息檢索。沒有網絡,不可能有海量信息檢索與計量。而互聯網的飛速發展,預示了網絡信息檢索與處理的誘人前景。人們不僅可以在瞬間搜索到所需要的信息,而且可以限定時間、空間(報紙、網站等信息提供者),設定各種邏輯關係,有針對性地搜索和精確計量;不僅可以搜索、計量文字信息,而且可以搜索、計量圖片、聲音和視頻信息;不僅可以搜索、計量傳統意義的「大內容」(Macro-contents),而且可以搜索、計量隨著Web 2.0而興盛的「微內容」(Micro-contents)。
我們現在可以方便地對一份報紙的全部歷史資料進行檢索,也可以方便地對幾百種報紙同時進行檢索。我們的鑰匙就是關鍵詞。每次檢索,電腦會給我們一個結果:某一關鍵詞的被使用篇數。這個結果如同人的體溫、江河水位、股票價格,是寶貴的研究依據。當然,電腦不會告訴你哪些詞應該被檢索;這完全要依賴我們對傳媒的持久觀察和經驗性研究。
從關鍵詞的破譯看大局態勢
我們要研究傳媒上各個關鍵詞的「語源」、「語境」、「語義」和「語義流變」。這種傳統的語言學方法,和基於互聯網平臺的檢索手段結合,使我們可以勾勒出更宏觀也更準確的圖像:傳媒在說什麼?什麼人在說?不同人(不同傳媒)所說的有何異同?在不同的時間,所說的又有什麼不一樣?
更具挑戰性的是對檢索結果的「破譯」:從紛繁的語言現象中,看出語言「棋盤」各個「棋子」的關係,看出錯綜的關係如何位移,識別偌大棋局的總體態勢。
運用這個方法,二零零一年,我曾檢索研究《解放軍報》,論證文化大革命從醞釀到爆發的過程,也是有關階級鬥爭、個人崇拜、扼制人性等紅色口號的勃興過程;二零零三年,我檢索研究了「輿論導向」、「輿論監督」、「新聞改革」和「新聞自由」四個關鍵詞的表現和相互關聯,指出中國新聞改革依然受到黨的嚴格控制,爭取新聞自由的道路艱難坎坷;二零零六年是唐山地震三十周年,我對中國大陸有關唐山地震的報導做了內容分析和話語分析,發現中國傳媒正在出現「靜悄悄的裂變」,新聞界奮力突破管制,呼喚人性和公民權利的民間話語在迅速生長。二零零七年,我的研究重點是政治改革。
在中國大陸,有六個詞是「政治體制改革」重要的相關詞。其中「民主政治」、「政治文明」和「黨內民主」屬官方話語,見諸于領導人講話、黨的檔、黨的媒體。而「憲政」、「公民權利」、「公民社會」則是民間話語,知識份子和追求自由的報紙用得較多。無疑,後者顯示的政改訴求更加切中要害。
目前官方話語的總體傳播強度高於民間話語。使用「慧科搜索」檢索二零零四年到二零零七年的中國報紙,我發現:多數使用「政治文明」或「民主政治」或「黨內民主」的文字,未使用民間話語中的任意一詞。而大多數使用「憲政」或「公民權利」或「公民社會」的文字,未使用官方話語中的任意一詞。同時使用兩者的文字,比重很低。
中共中央總書記胡錦濤在十七大的政治報告,使用了上述官方話語的三個詞,沒有使用民間話語的三個詞。這也可以證明,有關政治體制改革的兩種話語,確有明顯的分野。可以假設:未來五到十年,如果民間話語的比重漸大,官、民兩種話語的重合日多,那意味著什麼?意味著,中國政改將有較大的進展。你也可以想像相反的情形。
十七大召開前後,我在CMP網站(http://cmp.hku.hk)發表了十七篇文章,對中國傳媒上的「政治體制改革」話語作了詳細分析。正是這一分析,使我們對中國政治體制改革的現狀和前景持謹慎冷靜的態度:有期望,沒有奢望。我們看到政治改革的能量在積聚,也看到曾導致胡耀邦和趙紫陽兩任總書記下臺的紅色鐐銬︱「四項基本原則」,依然鎖著政治家們的雙腳。
一個面對中國傳媒和中國政治的傳媒話語觀測系統,正在逐步成型。這個系統可以幫助我們研究中國政治的轉型和中國傳媒的演變,也可以幫助我們研究中國社會的新陳代謝。目前各種搜索引擎已經開始建立對博客的搜索,假以時日,對不同關鍵詞在博客的傳播表現,將可以如報刊文本一樣被準確計量。這意味著,傳媒話語觀測系統還可以觀測千姿百態的民間輿論,解析輿情漲落的奧秘。