2016年4月4日 星期一

臺灣選舉地理:各直轄市及縣市的選民結構模型

作者:維基人 Sleepingstar (本文由作者提供)
 https://zh.wikipedia.org/wiki/User:Sleepingstar ,2015年03月10日。

前言
隨者臺灣在1980年代末期經歷解嚴、1990年代進行民主改革,臺灣的政治體制逐漸的由一黨獨大的局面,轉變爲多黨競爭的態勢。而歷年公職人員選舉結果,也往往呈現許多明顯的地理分布趨勢。

臺灣的選舉地理,大多以直轄市及縣市、鄉鎮市區層級等行政區、或立法委員選舉區,做為區域界線劃分,用以探討各區域的選民的政黨偏向,以及對各種政治議題的傾向。族群背景、統獨議題、社會階級等因素是影響選舉地理分布的重要因素,但隨著長期的族群融合、社會流動及公民意識的深化演進,這些已並非絕對。而各直轄市與縣市選舉結果除了選民的政黨偏向外,往往受到其他因素的影響,包括侯選人個人條件、地方派系、宗親力量、地方公共議題等。此外,選舉制度所造就的策略性投票行爲,如棄保效應、分裂投票等亦常影響選舉結果。

早在1990年代,時任國立臺灣大學政治系教授洪永泰便提出「政黨版圖」的概念,用以分析選舉結果的地理分布。為了解釋1998年直轄市長選舉結果,亦有許多學者及媒體工作者開始提出「政黨基本盤」的概念。而在2000年總統、副總統選後,臺灣媒體開始提出「北藍南綠」或「藍天綠地」,以及「決戰中台灣」、「跨越濁水溪」、「搶攻中間選民」等用詞,用以做「概括」、「概略」的統計與整理臺灣的選舉地理。

近年來,媒體報導往往用各直轄市及縣市「選民結構」、「基本盤」的估計,在選舉前推估可能得票結果,在選舉後評價各候選人或政黨的表現。然而這些數據往往缺乏嚴謹的計算方式,且選民結構亦屬於一種動態的數據,可能隨者新聞事件、政府效能、及經濟表現等因素變化。

筆著在本文中試圖探討臺灣的直轄市及縣市與全國得票相對分布,並提供計算各縣市直轄市及縣市選民結構的模型。最後,有鑑於國外諸多媒體、智庫、及學術機構長期追縱、統整政黨民意調查支持度(Poll tracker),筆者建議版主考慮追蹤、加權匯總臺灣政黨民意調查支持度,並利用模型推估各縣市直轄市及縣市當前的選民結構分布。這些數據或許能夠在預測未來選舉時,提供一些參考資料。

方法
考量侯選人個人條件在選舉中的影響,為控制這個變量(variable),本文僅考慮以全國為選區的選舉得票分布,以防止不同直轄市及縣市出現不同侯選人的效應。臺灣選舉史上,共有八次選舉以全國為選區:



在迴歸分析中,y 代表該政黨或政治陣營在各直轄市及縣市、或各立法委員選舉區,x 代表該政黨或政治陣營的全國得票率。迴歸分析除了納入歷屆選舉得票率數據點外,亦包括兩個自然數據,一、(0, 0)代表該政黨或政治陣營在全國得未獲得票數時(得票率 0%),在任何直轄市及縣市或立法委員選舉區亦未獲得票數(得票率 0%);二、(100, 100)代表該政黨或政治陣營在全國得獲得全體票數時(得票率 100%),在任何直轄市及縣市、或立法委員選舉區亦獲得全體票數(得票率 100%)。在製造各組模型時,筆者先試驗許多不同種類的迴歸分析,考量決定係數、合理度、曲線擬合、飽和度、數據點散佈、離群點等因素後,再挑選最合適的迴歸分析模型。

模型組(一)
本模型組考量泛藍、泛綠兩大陣營在臺灣各直轄市及縣市的總得票率分布。本模型組適用於大型相對多數制的選舉,包括總統副總統、直轄市長及縣市長選舉。

由於目前臺灣的政治體制仍然以泛藍、泛綠兩大陣營為主,兩大陣營內部票源重疊嚴重,且在大型相對多數制選舉亦往往呈現藍綠對決的狀況;故本模型組中筆者僅考量兩大陣營陣營的總得票率,而暫不考慮兩大陣營內部的票源分配。另外,由於在歷年各選舉中,泛綠陣營選情相對較爲單純,比較沒分裂因素,故模型以泛綠得票計算為主。泛綠陣營歷年的得票主要以民主進步黨、台灣團結聯盟、時代力量的總得票計算,但也包括其他泛綠或獨派的小黨,如建國黨、制憲聯盟等。

在各直轄市及縣市與全國得票相對分布,筆者曾經試驗過許多不同種類的迴歸分析,但在考量決定係數、合理度、曲線擬合、飽和度、數據點散佈、離群點等因素後,筆者最後採用以三元為主的多項式迴歸。在表格上呈現的係數由以下公式定義,其中 y 代表直轄市及縣市得票率,x 代表全國得票率:



模型組(二)
本模型組考量泛藍、泛綠兩大陣營在臺灣各立法委員選舉區的總得票率分布。本模型組適用於小型相對多數制的選舉,包括立法委員(區域)選舉。

然而,礙於選罷法的規定,以全國為選區的選舉的選票並無法區分出原住民選民的票數,故本模型並無法排除原住民選民的票數。在立法委員選舉時,原住民選民僅能能領原住民立法委員的選票,而無法參與區域立法委員投票,故本模型組在原住民人口較集中的立法委員選舉區的誤差較大。

由於目前臺灣的政治體制仍然以泛藍、泛綠兩大陣營為主,兩大陣營內部票源重疊嚴重,且在大型相對多數制選舉亦往往呈現藍綠對決的狀況;故本模型組中筆者僅考量兩大陣營陣營的總得票率,而暫不考慮兩大陣營內部的票源分配。另外,由於在歷年各選舉中,泛綠陣營選情相對較爲單純,比較沒分裂因素,故模型以泛綠得票計算為主。泛綠陣營歷年的得票主要以民主進步黨、台灣團結聯盟、時代力量的總得票計算,但也包括其他泛綠或獨派的小黨,如建國黨、制憲聯盟等。


在立法委員選舉區與全國得票相對分布,筆者曾經試驗過許多不同種類的迴歸分析,但在考量決定係數、合理度、曲線擬合、飽和度、數據點散佈、離群點等因素後,筆者最後採用以三元為主的多項式迴歸。在表格上呈現的係數由以下公式定義,其中 y 代表立法委員選舉區得票率,x 代表全國得票率:




模型組(三)
本模型組考量民主進步黨、中國國民黨、時代力量、親民黨等國內四黨政黨在各直轄市及縣市的得票率分布。本模型組適用於比例代表制的選舉,包括立法委員(不分區政黨)選舉。

礙於當前國內民意調查機構政黨支持度題組設計的限制,且當前立法院僅有民主進步黨、中國國民黨、時代力量、親民黨等四個黨團,故模型目前只納入當前國內四大黨。若未來民意調查題組、或國內政治局勢有所變化,筆者會考慮納入其他政黨。

在親民黨的得票分佈,筆者曾經試驗過許多不同種類的迴歸分析,但在考量決定係數、合理度、曲線擬合、飽和度、數據點散佈、離群點等因素後,筆者最後採用以二元為主的多項式迴歸。雖然筆者亦有分析2000年總統、副總統選舉時「宋張配」的得票數據,但在部份直轄市及縣市,這些數據點並未通過離群點測試,因而在迴歸分析時被自動排除。

在表格上呈現的係數由以下公式定義,其中 y 代表直轄市及縣市得票率,x 代表全國得票率:


而在時代力量的得票分佈,由於時代力量由於目前僅參與一次全國性選舉,即2016年立法委員(不分區政黨)選舉,因此僅能以二元多項式迴歸分析呈現。

在表格上呈現的係數由以下公式定義,其中 y 代表直轄市及縣市得票率,x 代表全國得票率:




結果

表格1:泛綠陣營各直轄市及縣市與全國得票相對分布多項式迴歸模型。


表格2:泛綠陣營各立法委員選舉區相對分布多項式迴歸模型。 


表格3:親民黨各直轄市及縣市與全國得票相對分布多項式迴歸模型。

表格4:時代力量各直轄市及縣市與全國得票相對分布多項式迴歸模型。


附錄:原始得票率數據下載連結


附件:泛綠陣營各直轄市及縣市與全國得票相對分布多項式迴歸結果














21 則留言:

  1. 感謝做這麼客觀理性的分析
    還此用3次方程表達
    應該有相當的準確性
    至少在得票率接近50趴附近都很準

    回覆刪除
  2. 感謝版主的採用

    修改一下筆誤:前言第三章節的第一句應為:"早在1990年代,時任國立臺灣大學政治系教授洪永泰便提出「政黨版圖」的概念"

    而非 "早在1990年代,時任國立臺灣大學政治系教授便提出「政黨版圖」的概念"

    回覆刪除
  3. 另外方法的第一章節,第二句,應為
    “臺灣選舉史上,共有十次選舉以 全國為選區”

    而非 “臺灣選舉史上,共有八次選舉以 全國為選區”

    表格上可能需要更新兩行:

    2016 總統、副總統 多數制
    2016 立法委員(不分區正黨) 比例代表制

    回覆刪除
    回覆
    1. 感謝大大對臺灣選民結構追蹤的建議與研究的分享!
      修正的部份已經更新

      刪除
  4. 這個公式我有空的時再就研究
    也許可以搞出好玩的東西

    回覆刪除
  5. 版主您好,

    在下近期完成了臺灣各立法委員選舉區選民分布推估模型,希望能夠對於版主預測下屆立法委員選舉提供一些參考資料,版主亦可考慮另設頁面與臺灣選民結構追蹤同步更新。

    模型的迴歸分析方法與臺灣各縣市選舉區選民分布推估模型相同。

    模型計算機在此:https://docs.google.com/spreadsheets/d/1BdIlYdx0BPt2ldrgS_m5BgE8CHeXvMIDw-ZxVq2bfpg/edit?usp=sharing

    原始得票率資料在此:https://docs.google.com/spreadsheets/d/1Uzlo0ghvmiGwG3iy64lEjJRDQvs1v1oL4gjNAv_EPRc/edit?usp=sharing

    模型迴歸分析係數表: https://docs.google.com/document/d/1NBggjQ6ZrvIOT6xJAxsEjh-0PBdYykm1pH1OINnAIgE/edit?usp=sharing

    回覆刪除
    回覆
    1. 非常感謝Sleepingstar大提供的『臺灣各立法委員選舉區選民分布推估模型』,
      這個推估模型對缺少民意調查的立法選舉可以提供重要的判斷依據與選後驗證。

      另外,立法委員選舉區細分各縣市選舉區,如大大建議,我會另設立法委員選舉區選民分布推估頁面,感謝了!

      刪除

    2. 畢竟那個我也想過
      只不過基本上我是有先整理總統資料啦
      縣市長的情況比較不太一樣

      刪除
    3. 也感謝羅藍提供 2000總統、2004 總統選舉的數據 ^^
      2012總統、2012政黨、2016總統、2016政黨數據則由中央研究院助研究員鮑彤提供。
      2008總統數據則來自淡江大學副教授謝相慶(http://www.npf.org.tw/2/9833)


      也正如同您所說的,縣市長選舉的得票數據並不適合納入迴歸分析,由於沒一個選區的候選人皆不同,且在選舉時候選人往往是影響選舉結果的重大因素之一。迴歸分析僅納入以全國為選區的選舉,以排除不同選區出現不同候選人的影響。因此只有歷屆總統副總統選舉、不分區政黨立法委員選舉、及任務型國民大會代表選舉適合。

      刪除
    4. 對像民代縣市長還是因為實力強弱的關係會造成不少的影響
      例如09年雲林縣
      雲林縣
      蘇治芬 1 女 1953 民主進步黨 229958 65.36% * 是
      吳威志 2 男 1965 中國國民黨 121832 34.63% 否
      14年雲林縣
      雲林縣
      張麗善 1 女 1964 中國國民黨 175862 43.02% 否
      李進勇 2 男 1951 民主進步黨 232900 56.97% * 否
      吳威志是大家公認的弱棒,而張麗善就是前縣長張榮味的妹妹(就是雲林最強的地頭蛇)
      又加上蘇治芬個人認為比李進勇強所以呵呵

      刪除
    5. 還有剛說的東西在我之前的公開資料夾裡,你可以看看
      https://drive.google.com/drive/folders/0BwE2cvxG9RZqX1IxQ2tnN2FPMGs

      刪除
  6. 版主您好,

    在下最後也提供四黨在臺灣各縣市選民分布推估模型。由於目前立法院僅有民主進步黨、中國國民黨、時代力量、親民黨等四個黨團,且礙於民意調查政黨支持度題組設計的限制,故模型目前只納入當前國內四大黨,若未來政治局勢、或民意調查題組有所變化,在下會考慮納入其他政黨。在親民黨的迴歸模型分析上,考量離群值分析、散佈等考量下,比較適合二元多項式迴歸,而時代力量由於目前僅參與一次全國性選舉,故也僅能以二元多項式迴歸呈現。民主進步黨方面則直接由泛綠總支持率扣除時代力量計算,而中國國民黨則由泛藍總支持率扣除親民黨計算。

    臺灣各四大政黨各縣市選民分布推估模型計算機在此:
    https://docs.google.com/spreadsheets/d/1soNfDRVaXUxd0pbAnjYbB851iq36h_eKrz-0odwn-Rg/edit?usp=sharing

    時代力量、親民黨各縣市選民分布推估模型係數:
    https://docs.google.com/document/d/14OXMwTpF_yz8-i3v3Floe9KLJFN07uAZCeXgkrYPLTw/edit?usp=sharing

    回覆刪除
    回覆
    1. 非常感謝Sleepingstar大再提供的『四黨選民分布推估模型』
      也非常感謝羅藍提供的數據及公開資料夾

      『四黨選民分布推估模型』與『臺灣各立法委員選舉區選民分布推估模型』
      我先研究一下,看看如何呈現在網頁上,感謝了!

      刪除
    2. 如果這個資料都是1996~20166次的話我就全部整理一下

      刪除
    3. 那不好意思我問一下公式的問題
      那請問那個b幾是要填啥東西

      刪除
    4. B0、B1、B2、B3、B4 乃多項式迴歸係數,您需要將每組資料:Y = 鄉鎮市區得票率,X = 全國得票率,進行多項式迴歸,以產生多項式迴歸係數,即 Y=B0+B1X+B2X^2+B3X^3。Excel 有基本的多項式迴歸,亦可使用 SPSS、Prism、SAS 等統計程式進行。

      刪除
    5. 我只能找時間想想看了

      刪除
    6. 最近下了SPSS,但第一次用這個軟體問題很多
      我就找時間慢慢摸索

      刪除
  7. 版主可考慮用新的說明檔案更新本頁面:https://docs.google.com/document/d/1YF6dUwyvU0nTW4LnVFZ3nEgH4bWFT78HEkFkmSTihHA/edit?usp=sharing

    回覆刪除
  8. 目前資料只差一點點
    目前完整資料的有:
    台北市 新北市 桃園市 宜蘭縣 嘉義市 新竹市 新竹縣 雲林縣 彰化縣 南投縣 台中市 苗栗縣

    回覆刪除