MIND REFERENCE: 北藍南綠？

2007年11月17日星期六

北藍南綠？

by Richter 2007/3/27

近年來，「北藍南綠」成為政治/媒體圈的熱門話題。這印象多半來自於縣市層級的得票率分布圖。從此種地圖上看起來，北部縣市確實都是藍色的，南部縣市也確實都是綠色的。因此要得出「北藍南綠」的結論，好像並非毫無根據。甚至有一種說法是：從 2000 年到 2004 年，綠營揮軍北上，將藍綠分界從濁水溪推進到大安溪。

不過，如果我們將得票率分布圖的統計單元從縣市改為鄉鎮，故事還會是這樣子嗎？

顯而易見的，北部好像沒有那麼藍了。在淡水河左岸、桃園縣沿海、東北角一帶，都出現了連片的綠色鄉鎮。南部縣市也並非全綠，在山地鄉的部分是深藍色的。此外，綠色的臺中縣與彰化縣，其實擁有不少藍色鄉鎮；而藍色的南投縣，也擁有許多綠色鄉鎮。這些細節，在縣市層級的分布圖中都被藏匿了。

如果我們進一步將得票率的統計單元改為村里，則會發現北部的綠色地盤變得更大了。以中壢市為例，在鄉鎮層級的分布圖中，被塗上中等藍色；但是在村里層級的分布圖中，大部分面積變成了綠色。類似的例子還有很多。這固然意味著綠營的選票分布比較均勻，而藍營的選票則集中在少數人口密集區。但是更弔詭的是，如果我們拿村里層級的分布圖來說故事，還能得出「北藍南綠」的結論嗎？

這就是使用地區資料的重大陷阱：「可調整地區單元問題」（modifiable areal unit problem, MAUP）。換言之，完全相同的一組資料，隨著地區單元的調整，很可能會產生不同的結果。

MAUP 包含兩種成分，第一種是「尺度效應」（scale effect），亦即不同的空間解析度使相同資料產生不同結果。一個有名的例子，是英格蘭小麥與馬鈴薯產量的關係。當統計單元是 48 個郡時，兩者相關係數只有 0.22；如果把郡歸併為 24 個分區，相關係數為 0.30；12 分區時，相關係數為 0.58；6 分區時，相關係數為 0.76；3 分區時，相關係數高達 0.99。當然，也有相關係數愈調愈低的例子。「北藍南綠」大概就是尺度效應所導致的結果。

MAUP 的另一種成分是「區劃效應」（zoning effect），亦即不同的區劃方式使相同資料產生不同結果。一個有名的例子，是 1968 年美國總統選舉時，Iowa 州 60 歲以上選民比例與共和黨得票率的關係。當統計單元是 99 個郡時，兩者相關係數是 0.346。如果將 99 個郡劃分為 30 個區，可以讓相關係數變成 0.98 ，也可以讓相關係數變成 -0.73。精心操作區劃效應，可以讓選區劃分產生「傑利蠑螈」。

因此，當我們看到任何一張以地區做為統計單元的分布圖時，是不是應該注意一下：地區單元是什麼？如果換成另一種地區單元，分布型態會不會變得不太一樣？這實在是個惱人的問題，幾乎所有研究者都不約而同地選擇迴避。

MIND REFERENCE

2007年11月17日星期六

北藍南綠？

部落格存檔

標籤

MIND REFERENCE

2007年11月17日 星期六

北藍南綠？

部落格存檔

標籤

2007年11月17日星期六