「眾人參與」人幾多?—估算公共事件參與人數

2011-11-15



  2011年有21萬人在香港「七一」遊行示威,還是只有6萬人?「六四」維園燭光晚會有6萬人抑或是15萬人?一萬名學生在倫敦街頭抗議學費上漲?100萬人聚集觀賞英國皇室婚禮? 果真如此嗎?筆者的忠告是:估算公共事件的參與人數是一項非常困難的工作,不要輕信媒體告訴你的。至少二十年前人類已經開始關注如何估算一簇人群到底包括多少人。《聖經》裡寫道:「那群吃東西的人除了婦女兒童之外,還包括大約五千男子。」(馬太福音 14:21)政治活動和公關活動長期以來都喜歡宣稱參與其活動的人數多達若干,但是不同機構或組織宣佈出的數據常常大相逕庭。原因有二:其一,估算人數本來就非常困難;其二,有些人更是有意想要得出一個錯誤的數據。

  估計人群大致可以分為兩種:一種是靜態地聚集在某些區域,另一種是動態地通過某些遊行線路。六四維園燭光晚會是第一種,七一遊行是第二種。參與人數至關重要,因為人們經常根據參與人數的多少判斷一項活動的成功與否。如果參與者眾多,該項運動就更加容易爭取其他人的加入,當權者也就更加難以拒絕他們的訴求。大型遊行示威之後,不同方面估算出的參與人數時常迥異。有的方面會誇大人數來為活動護航,有的方面則會低估人數來顯示活動不得人心。媒體大多會取個中間值來報導,但是也有些媒體會根據自身的政治立場選擇報導某些極端的數據。

外國的經驗

  1995年10月在華盛頓有一場號稱「百萬人大遊行」的社會運動。由於這個稱號,究竟多少人參與了這場遊行成為衡量活動成功與否的重要指標。遊行組織者估計參與人數介於150萬到200萬之間,美國公園警察則估算人數為40萬。結果國家公園管理處被告上了法庭。正當雙方辯論如火如荼時,波士頓大學遙控感應中心給出了一個折中的估算結果:87萬人,誤差範圍大約25%。不過公園管理處並沒有收回他們的估算數值,而且他們的估算得到了一些統計學家的支持。自這場關於「百萬人大遊行」參與人數的爭論之後,美國公園警察不曾再就遊行人數發出官方估算。

  即使在沒有政治訴求的情況下,人數估算依然可以引起很大分歧。例如最近的英國皇室婚禮的參與人數被估計為介於50萬至100萬不等。奧巴馬就職典禮的參與人數,一些人綜合衛星圖片、氣球上拍到的照片,以及當時在場人士拍到的照片推算出的結果是180萬人。有趣的是,其他人基於同樣的照片估算出的數值卻是約100萬人。

靜態人群估算 — 「六四」維園燭光晚會

  估算一個靜態人群的人數可以很簡單:將一個區域面積乘以該區域 的人口密度即可。這個方法最早由Jacobs在1967年提出,用以估算伯克利騷亂的參與人數。當時學生聚集的廣場被劃分成若干方格,只要數出方格的數量並估算出每個方格裡平均有多少學生,就可輕易得出總人數。他估算人群密度的法則到今天仍常常被使用:以站立的情況估計, 一個疏鬆人群的密度大約是每平方米有一個人,一個擁擠人群的密度大約是每平方米兩個人,一個極端擁擠人群的密度則大約是每平方米4個人。若要坐下來,相信每平方米能容納的人會更少。

  僅憑目測我們就可以做出快速的估算。想做好一點的話,你可以在現場抽取一個代表性方格作為樣本來點算。或者更好的話,根據現場的照片抽取樣本作出點算。通過這樣的取樣可以作出估算,也可以算出標準誤差。拍照是估算人群密度和聚集面積的最好基礎。拍照的方法可以有很多。如果重視圖片的質量,可以調整像素;或者也可以調節圖片的其他特性,例如紋理、邊緣點、形狀或者人頭點算。

  根據一張好的圖片,我們可以獲得一個人群聚集區域A的估計面積和標準誤差,以及人群密度D(見框一)。

  運算結果顯示,在目前的科技水平基礎上,一張中等尺寸的圖片帶來的相對標準誤差(RSE),

大約在10%左右。可能帶來二倍誤差的兼容性估算(英國皇室婚禮就是一例),其相對標準誤差為大約20%,這也是誤差範圍的上限。圖片可以幫助我們確定聚集區域的防禦邊界,再加上平均密度的合理邊界,我們就可以推算出樣本量的邊界。

  有了這些基礎,就比較容易判斷在一組差異巨大的估算結果裡,哪個更接近事實, 表一列出2004至2011年大會和警方的估算,兩者相差有二至三倍之多。最近維園紀念六四事件22週年的燭光集會,關於集會的參與人數,路透社、BBC等國際傳媒都引述了集會主辦方估算的數據:15萬人。而警方估算的數據是7萬7千人。地圖顯示這次集會地點的面積,合理的數據是A=42 000平方米。根據當晚集會現場的密集程度,我們估算人群密度略低於每平方米2人,最終的估算結果接近警方的數據。如果想得出主辦方所估算的15萬人,就意味著現場極端擁擠,人群密度接近每平方米4人。可是根據當晚的人群聚集情況,事實並非如此。

動態人群估算 — 「七一」遊行示威

  動態遊行時人群密度偏低並且易變,也增加了估算困難。動態的人群會隨著時間和地點發生變化:一個遊行隊伍的頭部通常較為有組織,尾部卻常常趨於鬆散,而當隊伍領袖要發表演講時,參與人群又霎時變得非常集中。因此對動態人群的估算比對靜態人群的估算更加不確定。例如2007年2月在倫敦發生的停戰大遊行,主辦方估計有6萬人參與,警方則估計為1萬人,雙方差異足足六倍。

  表二列出不同團體對歷屆「七一」遊行的人數估算。每年參與人數的準確性都一直都引起諸多爭論,但遺憾的是各方從沒有深入的討論,各自說話。其實估算類似這種動態遊行人數的難度在於,人們隨時都有可能加入或者離開遊行隊伍,不確定性非常大。統計工作者通常會在遊行隊伍會經過的主要地點設立觀測站,由觀察員在選定的時間段點算通過該站點的人數。遊行示威一般都會有一個焦點地段,通常這個點就設在最後的終點。但是,焦點地段也是最難點算人數的。通常情況下,這個焦點會發生在一個面積較大的區域,例如一個廣場,這時參與人群容易擴張,移動緩慢,並且波動很大。因此我們必須設置多個觀測站。基於這種方法,參與某次遊行的人數N就等於在特定遊行時段通過特定的遊行線路的總人數。以下我們將介紹兩種常用的定點觀測方法,每種方法都可以估算出參與人數N和標準誤差。

單點點算與電話跟進

  這種方法就是在距離焦點地段較近的位置選取觀測點A,點算通過這個位置的遊行人數。這樣我們就可以得出一個初步的估算。可是即使我們在這個時候的點算極盡精確,這個結果仍存在問題:有些參與者可能在到達這個觀測點之前就已經離開遊行隊伍,或者有些參與者在這個觀測點之後才加入隊伍。一種補救的辦法是在遊行之後在全部人口裡隨機抽取一些樣本進行電話調查。這就意味着我們首先要在抽樣樣本裡找到參與遊行的人士,然後要詢問他們是否有經過我們的觀測點,A。

  即使一個遊行示威規模非常大,其參與者往往也只是全部人口中的小部分。在全部人口裡進行抽樣電話調查就意味著我們可能要打非常非常多的電話才能找到一定的參與者。而電話調查還有其他問題:例如抽取的樣本可能不具有代表性,可能某些家庭或者集群被集體納入樣本,很多人可能不願意回應查詢,即使回應了,其真實性也值得懷疑,等等。此外,在一些高壓政治環境裡,例如「阿拉伯之春」所涵蓋的突尼西亞、埃及等國的遊行示威,其參與者很可能因為害怕受到迫害,而不願意在電話裡向陌生人承認他們參與了相關遊行。

  不過無論如何,如果具備可行性的話,電話調查可以輔助地面點算,讓我們得出一個估算值和標準誤差。這也是香港大學民調中心所採取的方法,但香港大學的民調方法即時沒有當天的到達這個觀測點之前就已經離開遊行隊伍的估算,便需要借用舊年用電話訪問中所搜集的數據作為今年的運算基礎。這是其中一個限制和不準確的原因。但值得一提,這個估計通常會在警方和主辦單位之間,但這不代表一定是準確的。根據筆者理解,警方的估算是在遊行路線設立三個觀察點作出點算的。

雙點複查與定點調查

  如果不想使用電話調查,筆者與多位統計的學者提議另一種方法,是在遊行線路中選擇兩個點A和B,而非一個點,作為觀測點。這兩個點不宜太靠近,其中一個點應鄰近終點。當然這種方法也不是完美的:有的參與者可能只經過其中的一個點,或者有的人兩個點都沒有經過。這種方法增加了點算的花費,也增加了下面我們要講到的定點問卷調查的花費,不過卻省下了電話調查在時間和物資上的耗費,也避免了電話調查帶來的偏差。這種方法的優勢在於高效、及時。

  將電話調查和雙點複查兩種方法算出的標準誤差進行對比,我們可以看到雙點複查的方法可以提供一個較為精準的數據。此外,雙點複查的數據更為及時,在點算當天就可算出。

  表二列出2003年至2011年的結果,遊行主辦方所估算的數據一直都比警方的數據高出二到三倍。但值得一提,因04年主辦單位的計算出現明顯[植樹問題]錯誤之後,當年仍堅持有53萬人參加。在05年,主辦單位使用另外一種數算方法,結果則出乎意外地相似,無論是警方、港大民調、筆者和主辦單位都是兩萬人左右。在05年,筆者、港大民調與及警方都沒有改變統計人數的方法。但很可惜,主辦單位並沒有認真正視這個問題。06年之後,故態復萌,參與人數再回復二、三倍之分歧現象。

結論

  每年「六四」晚會和「七一」遊行的人數總是新聞一則,但很可惜地,一些資深的傳媒人士對處理主辦單位的數目都是人格分裂,明知數目不對,還是要用頭條報導,在網上更充斥一些不求甚解的言論,難道傳媒工作者的求平持真的態度在這些地方便會自動消失嗎?

  我們堅信一個盡量精準的估算比一個「公關化妝」式的估算能夠更好地服務公眾。筆者建議所有參與計算者都要清楚交代數據,而媒體則有責任評核資料的可信性。如此可避免一些不負責任的估算,也可以為日後比較不同的估算結果提供基礎。如果某項遊行被視為吻合公眾利益的,那麼誇大其參與人數就會被視為善意的謊言,而低估人數則會被視為政治上居心叵測。我們應該以懷疑警惕的態度看待這些估算結果。


後記:本文章是基於Watson and Yip (2011) 在統計權威期刊Significance 所發表的一篇文章翻譯而成。
下載
相關文章 / Related Articles

警隊與社交媒體

黃子健、馬偉傑
2017-05-08

2016年度新聞與社交媒體使用行為調查

馬偉傑 周展樑 葉詩穎 伍淑冰 梁俊仁
2016-09-21

中國的"互聯網主權"論

胡泳
2016-01-13