臺灣選舉地理：各直轄市及縣市的選民結構模型

4月 04, 2016

本文由作者提供

作者：維基人 Sleepingstar
https://zh.wikipedia.org/wiki/User:Sleepingstar ，2015年03月10日。

前言
隨者臺灣在1980年代末期經歷解嚴、1990年代進行民主改革，臺灣的政治體制逐漸的由一黨獨大的局面，轉變爲多黨競爭的態勢。而歷年公職人員選舉結果，也往往呈現許多明顯的地理分布趨勢。

臺灣的選舉地理，大多以直轄市及縣市、鄉鎮市區層級等行政區、或立法委員選舉區，做為區域界線劃分，用以探討各區域的選民的政黨偏向，以及對各種政治議題的傾向。族群背景、統獨議題、社會階級等因素是影響選舉地理分布的重要因素，但隨著長期的族群融合、社會流動及公民意識的深化演進，這些已並非絕對。而各直轄市與縣市選舉結果除了選民的政黨偏向外，往往受到其他因素的影響，包括侯選人個人條件、地方派系、宗親力量、地方公共議題等。此外，選舉制度所造就的策略性投票行爲，如棄保效應、分裂投票等亦常影響選舉結果。

早在1990年代，時任國立臺灣大學政治系教授洪永泰便提出「政黨版圖」的概念，用以分析選舉結果的地理分布。為了解釋1998年直轄市長選舉結果，亦有許多學者及媒體工作者開始提出「政黨基本盤」的概念。而在2000年總統、副總統選後，臺灣媒體開始提出「北藍南綠」或「藍天綠地」，以及「決戰中台灣」、「跨越濁水溪」、「搶攻中間選民」等用詞，用以做「概括」、「概略」的統計與整理臺灣的選舉地理。

近年來，媒體報導往往用各直轄市及縣市「選民結構」、「基本盤」的估計，在選舉前推估可能得票結果，在選舉後評價各候選人或政黨的表現。然而這些數據往往缺乏嚴謹的計算方式，且選民結構亦屬於一種動態的數據，可能隨者新聞事件、政府效能、及經濟表現等因素變化。

筆著在本文中試圖探討臺灣的直轄市及縣市與全國得票相對分布，並提供計算各縣市直轄市及縣市選民結構的模型。最後，有鑑於國外諸多媒體、智庫、及學術機構長期追縱、統整政黨民意調查支持度（Poll tracker），筆者建議版主考慮追蹤、加權匯總臺灣政黨民意調查支持度，並利用模型推估各縣市直轄市及縣市當前的選民結構分布。這些數據或許能夠在預測未來選舉時，提供一些參考資料。

方法
考量侯選人個人條件在選舉中的影響，為控制這個變量（variable），本文僅考慮以全國為選區的選舉得票分布，以防止不同直轄市及縣市出現不同侯選人的效應。臺灣選舉史上，共有八次選舉以全國為選區：

在迴歸分析中，y 代表該政黨或政治陣營在各直轄市及縣市、或各立法委員選舉區，x 代表該政黨或政治陣營的全國得票率。迴歸分析除了納入歷屆選舉得票率數據點外，亦包括兩個自然數據，一、（0, 0）代表該政黨或政治陣營在全國得未獲得票數時（得票率 0%），在任何直轄市及縣市或立法委員選舉區亦未獲得票數（得票率 0%）；二、（100, 100）代表該政黨或政治陣營在全國得獲得全體票數時（得票率 100%），在任何直轄市及縣市、或立法委員選舉區亦獲得全體票數（得票率 100%）。在製造各組模型時，筆者先試驗許多不同種類的迴歸分析，考量決定係數、合理度、曲線擬合、飽和度、數據點散佈、離群點等因素後，再挑選最合適的迴歸分析模型。

模型組（一）
本模型組考量泛藍、泛綠兩大陣營在臺灣各直轄市及縣市的總得票率分布。本模型組適用於大型相對多數制的選舉，包括總統副總統、直轄市長及縣市長選舉。

由於目前臺灣的政治體制仍然以泛藍、泛綠兩大陣營為主，兩大陣營內部票源重疊嚴重，且在大型相對多數制選舉亦往往呈現藍綠對決的狀況；故本模型組中筆者僅考量兩大陣營陣營的總得票率，而暫不考慮兩大陣營內部的票源分配。另外，由於在歷年各選舉中，泛綠陣營選情相對較爲單純，比較沒分裂因素，故模型以泛綠得票計算為主。泛綠陣營歷年的得票主要以民主進步黨、台灣團結聯盟、時代力量的總得票計算，但也包括其他泛綠或獨派的小黨，如建國黨、制憲聯盟等。

在各直轄市及縣市與全國得票相對分布，筆者曾經試驗過許多不同種類的迴歸分析，但在考量決定係數、合理度、曲線擬合、飽和度、數據點散佈、離群點等因素後，筆者最後採用以三元為主的多項式迴歸。在表格上呈現的係數由以下公式定義，其中 y 代表直轄市及縣市得票率，x 代表全國得票率：

模型組（二）
本模型組考量泛藍、泛綠兩大陣營在臺灣各立法委員選舉區的總得票率分布。本模型組適用於小型相對多數制的選舉，包括立法委員（區域）選舉。

然而，礙於選罷法的規定，以全國為選區的選舉的選票並無法區分出原住民選民的票數，故本模型並無法排除原住民選民的票數。在立法委員選舉時，原住民選民僅能能領原住民立法委員的選票，而無法參與區域立法委員投票，故本模型組在原住民人口較集中的立法委員選舉區的誤差較大。

由於目前臺灣的政治體制仍然以泛藍、泛綠兩大陣營為主，兩大陣營內部票源重疊嚴重，且在大型相對多數制選舉亦往往呈現藍綠對決的狀況；故本模型組中筆者僅考量兩大陣營陣營的總得票率，而暫不考慮兩大陣營內部的票源分配。另外，由於在歷年各選舉中，泛綠陣營選情相對較爲單純，比較沒分裂因素，故模型以泛綠得票計算為主。泛綠陣營歷年的得票主要以民主進步黨、台灣團結聯盟、時代力量的總得票計算，但也包括其他泛綠或獨派的小黨，如建國黨、制憲聯盟等。

在立法委員選舉區與全國得票相對分布，筆者曾經試驗過許多不同種類的迴歸分析，但在考量決定係數、合理度、曲線擬合、飽和度、數據點散佈、離群點等因素後，筆者最後採用以三元為主的多項式迴歸。在表格上呈現的係數由以下公式定義，其中 y 代表立法委員選舉區得票率，x 代表全國得票率：

模型組（三）
本模型組考量民主進步黨、中國國民黨、時代力量、親民黨等國內四黨政黨在各直轄市及縣市的得票率分布。本模型組適用於比例代表制的選舉，包括立法委員（不分區政黨）選舉。

礙於當前國內民意調查機構政黨支持度題組設計的限制，且當前立法院僅有民主進步黨、中國國民黨、時代力量、親民黨等四個黨團，故模型目前只納入當前國內四大黨。若未來民意調查題組、或國內政治局勢有所變化，筆者會考慮納入其他政黨。

在親民黨的得票分佈，筆者曾經試驗過許多不同種類的迴歸分析，但在考量決定係數、合理度、曲線擬合、飽和度、數據點散佈、離群點等因素後，筆者最後採用以二元為主的多項式迴歸。雖然筆者亦有分析2000年總統、副總統選舉時「宋張配」的得票數據，但在部份直轄市及縣市，這些數據點並未通過離群點測試，因而在迴歸分析時被自動排除。

在表格上呈現的係數由以下公式定義，其中 y 代表直轄市及縣市得票率，x 代表全國得票率：

而在時代力量的得票分佈，由於時代力量由於目前僅參與一次全國性選舉，即2016年立法委員（不分區政黨）選舉，因此僅能以二元多項式迴歸分析呈現。

在表格上呈現的係數由以下公式定義，其中 y 代表直轄市及縣市得票率，x 代表全國得票率：

結果

表格1：泛綠陣營各直轄市及縣市與全國得票相對分布多項式迴歸模型。

表格2：泛綠陣營各立法委員選舉區相對分布多項式迴歸模型。

表格3：親民黨各直轄市及縣市與全國得票相對分布多項式迴歸模型。

表格4：時代力量各直轄市及縣市與全國得票相對分布多項式迴歸模型。

附錄：原始得票率數據下載連結

附件：泛綠陣營各直轄市及縣市與全國得票相對分布多項式迴歸結果

留言

Unknown2016年4月1日下午6:29
感謝做這麼客觀理性的分析
還此用3次方程表達
應該有相當的準確性
至少在得票率接近50趴附近都很準
讚
回覆刪除
回覆
Unknown2016年4月2日清晨6:17
感謝版主的採用

修改一下筆誤：前言第三章節的第一句應為："早在1990年代，時任國立臺灣大學政治系教授洪永泰便提出「政黨版圖」的概念"

而非 "早在1990年代，時任國立臺灣大學政治系教授便提出「政黨版圖」的概念"

回覆刪除
回覆
Unknown2016年4月2日清晨6:51
另外方法的第一章節，第二句，應為
“臺灣選舉史上，共有十次選舉以全國為選區”

而非 “臺灣選舉史上，共有八次選舉以全國為選區”

表格上可能需要更新兩行：

2016 總統、副總統多數制
2016 立法委員（不分區正黨）比例代表制
回覆刪除
回覆
羅藍2016年4月2日上午10:36
這個公式我有空的時再就研究
也許可以搞出好玩的東西
回覆刪除
回覆
Unknown2016年4月8日下午3:58
版主您好，

在下近期完成了臺灣各立法委員選舉區選民分布推估模型，希望能夠對於版主預測下屆立法委員選舉提供一些參考資料，版主亦可考慮另設頁面與臺灣選民結構追蹤同步更新。

模型的迴歸分析方法與臺灣各縣市選舉區選民分布推估模型相同。

模型計算機在此：https://docs.google.com/spreadsheets/d/1BdIlYdx0BPt2ldrgS_m5BgE8CHeXvMIDw-ZxVq2bfpg/edit?usp=sharing

原始得票率資料在此：https://docs.google.com/spreadsheets/d/1Uzlo0ghvmiGwG3iy64lEjJRDQvs1v1oL4gjNAv_EPRc/edit?usp=sharing

模型迴歸分析係數表： https://docs.google.com/document/d/1NBggjQ6ZrvIOT6xJAxsEjh-0PBdYykm1pH1OINnAIgE/edit?usp=sharing
回覆刪除
回覆
Unknown2016年4月9日凌晨4:51
版主您好，

在下最後也提供四黨在臺灣各縣市選民分布推估模型。由於目前立法院僅有民主進步黨、中國國民黨、時代力量、親民黨等四個黨團，且礙於民意調查政黨支持度題組設計的限制，故模型目前只納入當前國內四大黨，若未來政治局勢、或民意調查題組有所變化，在下會考慮納入其他政黨。在親民黨的迴歸模型分析上，考量離群值分析、散佈等考量下，比較適合二元多項式迴歸，而時代力量由於目前僅參與一次全國性選舉，故也僅能以二元多項式迴歸呈現。民主進步黨方面則直接由泛綠總支持率扣除時代力量計算，而中國國民黨則由泛藍總支持率扣除親民黨計算。

臺灣各四大政黨各縣市選民分布推估模型計算機在此：
https://docs.google.com/spreadsheets/d/1soNfDRVaXUxd0pbAnjYbB851iq36h_eKrz-0odwn-Rg/edit?usp=sharing

時代力量、親民黨各縣市選民分布推估模型係數：
https://docs.google.com/document/d/14OXMwTpF_yz8-i3v3Floe9KLJFN07uAZCeXgkrYPLTw/edit?usp=sharing
回覆刪除
回覆
Unknown2016年4月9日清晨6:47
版主可考慮用新的說明檔案更新本頁面：https://docs.google.com/document/d/1YF6dUwyvU0nTW4LnVFZ3nEgH4bWFT78HEkFkmSTihHA/edit?usp=sharing
回覆刪除
回覆
羅藍2016年5月22日晚上9:22
目前資料只差一點點
目前完整資料的有：
台北市新北市桃園市宜蘭縣嘉義市新竹市新竹縣雲林縣彰化縣南投縣台中市苗栗縣
回覆刪除
回覆