藍白合雙方因柯文哲禮讓民調誤差範圍「3%」(6 個百分點)或「3 個百分點」(1.5%)各執一詞,合推的總統候選人正副人選持續延宕。馬政府前文建會主委、曾任多個民調機構諮詢委員的盛治仁指出,今天(18日)一天,發現統計基本原理被推翻,抽樣誤差不再是正負 3%,讓他感嘆指,「數學基礎不會因為政黨立場而改變」。
盛治仁在臉書上以自己 5 日的文章作解釋,當時藍白尚未在協商後提出「若在統計範圍內,由侯柯配得一點。」等的 6 點共識。
他以和 AI 聊天機器人 ChatGPT 的實際問答替大家複習統計學。盛治任詢問 AI ,若民意調查維持在 95%的信心水準下,樣本數為 500、1000,和 10000 份時,各自抽樣誤差為多少?
AI 回答,在 95%的信心水平下,樣本數為 500 時的抽樣誤差為約 4.4%,樣本數為 1000 時的抽樣誤差為約 3.1%,樣本數為 10000 時的抽樣誤差為約 1.0%。
盛治仁當時評論指,因此柯若要讓抽樣誤差範圍,侯可以說做 500 份,3 或 4 位候選人放在同一題目裡面讓選民選,抽樣誤差在 4.4%下,就等於讓了 8.8%,而最普遍的 1068 份樣本,就是讓 6%。
綜合各大平台資訊,可得結論:「樣本越多,誤差範圍越小」。以台灣近 1950 萬選舉人的母體規模為例,民調結果要在 95%信心水準下,達到 3%內的誤差範圍,取得之有效樣本數應至少達到 1068 份。也因此,不同民調機構互異的抽樣數,做出的抽樣誤差都不盡相同。
在權衡訪問成本、時間、誤差後,台灣多數民調機構會將誤差範圍限縮在「3%」內,抽取 1068 份樣本(即接受調查,並做有效回答的受訪者)。假設以 A 的 30%,及 B 的 24%支持度作比較,兩者加計 3%的統計誤差後,支持度範圍分別是 27%~33%,及 21%~27%。即使支持度差距為 6%,兩者各自極端值都出現 27%,因此部分對比式民調解讀確實要以兩倍抽樣誤差作為衡量標準。