比起選舉的熱鬧,何麗萍更著迷於統計。從東海統計系、師承民調先驅洪永泰,到與學姐潘惠年兩人從無到有打造「山水民調」,她一步步把一家只有兩個人、四十線的小公司,做成台灣選舉研究裡的關鍵角色。

兩家民調公司做同一個選區,結果竟然一個贏5%、一個輸5%。何麗萍說,問題往往不在「準不準」,而在規則與設計。她拆解看穿假民調的幾個關鍵:公布單位、完整問卷、政黨傾向——以及最常被動手腳的「政黨加權」。

Q:國民黨過去沒有統一的初選規則,這會造成什麼問題?

當前熱搜:立院強過「高虹安條款」 柯文哲:請正名叫「林淑芬條款」

十幾年前曾有國民黨客戶找我做民調,他確定自己民調很高,跟我說他們要做初選決定提名人,初選做完民調也很高,但最後卻跟我說他不參選了。原因是國民黨那時還沒白紙黑字寫好用初選決定提名,還是要參考各種意見。雖然初選最高,但若執意參選,他們也有壓力,順了姑意逆了嫂意。所以後決定禮讓,成全他人。

他們當初並沒有像民進黨明白把初選規則寫進去。一直到現在,國民黨的提名還是地方黨部各自負責,像六都的地方黨部,也可能各自有不同規則。

可是民進黨不是。民進黨從總統到六都選舉都是中央統籌,而且中央有民調中心。我覺得這是民進黨很在乎民調、一路堅持到現在的重要因素。國民黨很早就成立民調宣傳會,但現在全部裁撤,因為沒有自己的民調中心,就沒有最終統籌的方式。

當前熱搜:唐玉琴退出屏東縣議員提名作業 縣黨部:團結爭取國民黨勝選

觀察國民黨初選最近陸續公佈的民調——剛好看到某一選區(中山大同)委託兩家民調公司做的民調結果竟然勝負不一致:一家做A贏5%,另一家做A輸5%,兩個候選人,在兩家民調公司結果完全不同。這在民進黨初選民調,很少看到這麼大差異。

Q:同一個選區,原因出在哪?

結果不同的原因我不知道,所以不說誰準誰不準。而是如果沒訂統一的規則跟抽樣的辦法,兩家民調公司用各自的方式做,就可能發生抽樣偏差。

民進黨中央做初選,一定是中央黨部抽樣好再給民調公司做,大家的抽樣來源一致;而國民黨(或者民進黨某些地方黨部)則讓民調公司各自抽樣,如果沒有訂好一致的規則,則抽樣方式的不同,很可能會造成不一樣的結果。

山水若接受初選委託,不論是國民黨或民進黨,都會跟各家民調公司確認抽樣規則與執行作法一致。標準流程下,只要抽樣一致、執行流程一致,做出來的準確度就不會差太多。

Q:想導向特定結果的策略性民調,讀者要怎麼看穿?

大家已經很習慣看公佈的單位。公佈單位的可信度很重要,我相信民調只要掛上山水執行,拿出去是會被接受的,所以公佈的單位很重要,你要看它過去的累積跟經驗。

再來最基本的是問卷題目。我都跟客戶說,要公佈民調就盡量完整公佈,把題目都公佈,不要只公佈數字。你只公佈數字說支持度誰高誰低,卻沒公佈完整題目,我不知道你怎麼問的。舉個例子,假如題目這樣問:「我們有一位非常優秀的年輕人○○○,要對上某某某,請問你支持誰?」這樣問,明眼人一看就知道答案會被導到哪一邊。

再來是基本資料的觀察。完整的民調除了題目,所有報表都要公佈,比如性別、年齡、教育程度跟政黨傾向。性別、年齡、教育程度大家都夠標準,會加權到符合母體;只有政黨傾向是最終的觀察,可以看它跟這地區的政治版圖一不一樣。

比如做一個台北市民調,結果民進黨40%、國民黨30%,民進黨支持度肯定很高,可是台北市的政治版圖不是這樣,是藍大於綠。從政黨傾向的觀察,就能看出這民調夠不夠準。有人會說政治版圖會變化,這也是我們做選舉研究常研究的,可是絕對不是一天兩天、甚至一週兩週就能改變,可以長期觀察。這兩個點抓住,長期看就比較沒問題。

Q:民調和開票結果落差大時,常被歸咎於「加權不準」,您怎麼看?

我完全不同意推給加權,跟母體結構一致的加權是必要的。除非你做了不對的加權。一份民調問完,要先做基本資料檢定,檢定性別、年齡,看符不符合母體比例。

男女本該一半一半,可是市話民調問起來常常女生六成、男生四成;年輕人佔比可能要20%,市話問起來可能只剩6%,就是不符合母體的樣本比例。把樣本過多的女生比例壓低、把樣本過少的年輕人比例拉高,這就是加權。

這才是標準,這樣母體才有代表性,誤差並不會放大。同一族群叫同類人,意見比較相似;某一類被壓低,比例就更低。樣本過小沒關係,先透過加權提高,做好符合母體的代表性,才是加權後該有的民調結果。

準不準,可以由選舉開票結果驗證。這麼多年,透過加權處理民調後跟開票結果一致,代表年輕人雖少,透過加權膨脹仍有代表性。在家接電話的年輕人,跟在外接不到電話的年輕人,想法一樣;年輕人跟年長者想法不同,但不會因為在家或不在家而改變。

Q:以2024年藍白合(柯侯配)的民調差異為例,藍白兩陣營公布的結果為何差那麼多?

的確有人推給加權或手機民調;做手機民調,確實有可操作的空間。

我們公司現在固定每月做一半手機、一半市話,獨立加權後合併。這很像兩套抽樣工具,各自隨機抽樣、各自符合母體加權,再合併平均誤差。有些人先合併,把兩個不同的抽樣架構混在一起再加權,變動性就很大。

再來是遊戲規則,他們好像是拿過去前幾份民調來平均,那就有意思了——拿過去的民調,就看你怎麼選擇。民調再認真做都有抽樣誤差,同一時間做,數字都不會完全一樣;抽樣誤差正負3%,跳動空間很大,所以我只能說,他們當初是在選擇上出了問題。

另一個是觀察藍綠比。真正的加權是做性別、年齡、教育程度的樣本代表性檢定;如果做了政黨加權,覺得民眾黨要15%就拉高、覺得民進黨只能20%就設成20%,那是不對的。真的去做政黨加權,那才是不實的民調。所以我提醒大家,要看政黨支持度的比例是不是被加權過後的結果。