北藍南綠?
by Richter 2007/3/27
近 年來,「北藍南綠」成為政治/媒體圈的熱門話題。這印象多半來自於縣市層級的得票率分布圖。從此種地圖上看起來,北部縣市確實都是藍色的,南部縣市也確實 都是綠色的。因此要得出「北藍南綠」的結論,好像並非毫無根據。甚至有一種說法是:從 2000 年到 2004 年,綠營揮軍北上,將藍綠分界從濁水溪推進到大安溪。
不過,如果我們將得票率分布圖的統計單元從縣市改為鄉鎮,故事還會是這樣子嗎?
顯 而易見的,北部好像沒有那麼藍了。在淡水河左岸、桃園縣沿海、東北角一帶,都出現了連片的綠色鄉鎮。南部縣市也並非全綠,在山地鄉的部分是深藍色的。此 外,綠色的臺中縣與彰化縣,其實擁有不少藍色鄉鎮;而藍色的南投縣,也擁有許多綠色鄉鎮。這些細節,在縣市層級的分布圖中都被藏匿了。
如 果我們進一步將得票率的統計單元改為村里,則會發現北部的綠色地盤變得更大了。以中壢市為例,在鄉鎮層級的分布圖中,被塗上中等藍色;但是在村里層級的分 布圖中,大部分面積變成了綠色。類似的例子還有很多。這固然意味著綠營的選票分布比較均勻,而藍營的選票則集中在少數人口密集區。但是更弔詭的是,如果我 們拿村里層級的分布圖來說故事,還能得出「北藍南綠」的結論嗎?
這就是使用地區資料的重大陷阱:「可調整地區單元問題」(modifiable areal unit problem, MAUP)。換言之,完全相同的一組資料,隨著地區單元的調整,很可能會產生不同的結果。
MAUP 包含兩種成分,第一種是「尺度效應」(scale effect),亦即不同的空間解析度使相同資料產生不同結果。一個有名的例子,是英格蘭小麥與馬鈴薯產量的關係。當統計單元是 48 個郡時,兩者相關係數只有 0.22;如果把郡歸併為 24 個分區,相關係數為 0.30;12 分區時,相關係數為 0.58;6 分區時,相關係數為 0.76;3 分區時,相關係數高達 0.99。當然,也有相關係數愈調愈低的例子。「北藍南綠」大概就是尺度效應所導致的結果。
MAUP 的另一種成分是「區劃效應」(zoning effect),亦即不同的區劃方式使相同資料產生不同結果。一個有名的例子,是 1968 年美國總統選舉時,Iowa 州 60 歲以上選民比例與共和黨得票率的關係。當統計單元是 99 個郡時,兩者相關係數是 0.346。如果將 99 個郡劃分為 30 個區,可以讓相關係數變成 0.98 ,也可以讓相關係數變成 -0.73。精心操作區劃效應,可以讓選區劃分產生「傑利蠑螈」。
因此,當我們看到任何一張以地區做為統計單元的分布圖時,是不是應該注意一下:地區單元是什麼?如果換成另一種地區單元,分布型態會不會變得不太一樣?這實在是個惱人的問題,幾乎所有研究者都不約而同地選擇迴避。