作者 NewYAWARA (朝霞之前奏)
標題 Re: [討論] 民眾黨內參民調原始數字流出
時間 Mon Dec 11 20:46:20 2023


※ 引述《a10141013 (FlyBall)》之銘言:
: https://i.imgur.com/pkUMcld.jpeg
[文長恕刪]

今天有索取到民眾黨官方寄來的所謂raw data資料,
有興趣的話可自行參閱: https://tinyurl.com/4tfhmhhv

 

以下是幾個比較明顯的問題點:

一、提供的並非是raw data資料
一般而言在民調上指的raw data,是指從調查或研究中直接收集到的數據,
這些數據在被記錄時尚未經過任何處理、分析或加權。

換言之,最好的情況是提供民調的SPSS檔讓人直接去做分析,
如果沒有的話,至少要包含市話加權前交叉表、手機加權前交叉表,
這樣才能更仔細的去做比對及推測使用的加權方式看看是否合理。
畢竟單純只說依照戶籍、年齡、性別、教育程度的多重反覆加權,
無法了解市話與手機合併時的各自樣本代表權重

(顯然不是單純的市話7手機3的比例下去合併)。

二、手機樣本的過度高估
由於民眾黨所提供的資料,並沒說明市話及手機整併時的權重,
但因為他們的交叉表有做「電話使用行為」,
所以大概可以推測是使用雙底冊方式整併。
但即使是雙底冊,也有不同的整併方式,這邊就不額外說明,
只是當民眾黨沒說明是怎麼整併時,我們不容易看出加權是否合理。

因為他們所提供的資料,沒有市話、手機在加權前的交叉分析表,
我們只能就手上既有的資料來做粗略的推論。
通常會出現問題的,就是在年輕樣本的估算上,
因為找到的樣本數少,所以一開始取樣時就容易有偏誤,
而願意接聽手機並作答的族群,有可能偏好與不接聽的有所不同,
就有可能會因此更加放大差異。

若我們就針對20-29歲的樣本來做粗略檢證的話,
我們得知加權後的柯盈配支持率是55.7%,
所以還原回來,樣本數是97份(174*0.557)。

而我們從柯盈配在市話加權後的數據是18.9%來看,
參照多數類似的市話民調,我們先假定在這個年齡層,
柯盈配拿到的是40%支持率左右,換算回來,
在市話的原始樣本則是22份(55*0.4),
接著從市話併手機的加權前數據,膨脹為加權後數據時,
權重是167%(104份樣本變174份樣本),
因此市話加權完後的樣本,則會因此膨脹為37份。

那麼,手機樣本在此佔多少呢?我們把加權完後總份數97份,
減掉市話樣本37份,所以我們可知手機樣本在加權後約佔60份。
而我們再把手機樣本還原為還沒加權前,大約是36份(60 / 1.67)。
36份則是佔手機加權前樣本的73.5%(36 / 49)。
換言之,柯盈配在手機的20-29歲原始樣本,可能是超過七成的支持率,
這與現實世界實際情況可能並不相符。

若是很單純的將市話及手機個別加權完後再整併,
那麼由於市話佔了70%的比重,在市話支持率40%、手機支持率73.4%的情況下,
整併後會是50%左右,會比兩種樣本先加起來,再開始加權後的55.7%要來的低。
而由於柯文哲佔優勢的30-39歲的樣本有著完全一樣的問題,

因此按照民眾黨的加權方式,對於柯文哲提升支持率就會有更大的幫助。

三、加權的不穩定
在這邊我們很明顯的會發現三個主要的問題:
1. 不同的加權方式會大幅影響最終的整併結果
2. 柯盈配在手機年輕樣本的支持率會有嚴重高估傾向
3. 手機看似只佔三成比重,實際上會因年輕樣本仍不足以彌補市話不足,
使得加權後會再更放大手機年輕樣本的偏誤(權重膨脹67%)

這也說明了為何純市話的加權後結果,
柯盈配的支持率僅是從13.2%膨脹為18.9%,
但是市話併手機後的結果,卻會大幅膨脹到27.6%的原因。


以上大概是幾點研究完民眾黨提供資料的想法,
最主要還是手機調查很可能會放大偏誤,
而市話併手機時,沒有詳細交代加權方式,
則會讓人無法信服,特別是在年齡加權會深刻影響結果時。
這些是民眾黨內參民調之後需要去克服的問題。

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 210.66.250.226 (臺灣)
※ 作者: NewYAWARA 2023-12-11 20:46:20
※ 文章代碼(AID): #1bTmIUZC (HatePolitics)
※ 文章網址: https://www.ptt.cc/bbs/HatePolitics/M.1702298782.A.8CC.html
※ 同主題文章:
Re: [討論] 民眾黨內參民調原始數字流出
12-11 20:46 NewYAWARA
gnd20012002: 結論:自我膨脹自爽用的民調1F 39.10.1.68 台灣 12/11 20:49
ok020402: 遠比沒資料還全市話的好太多了2F 118.171.160.23 台灣 12/11 20:50
gnd20012002: 好的哭15%3F 39.10.1.68 台灣 12/11 20:50
Hohenzollern: 侯友宜市話28.4%/手機25.6%/市話+手機卻倒扣到24.3%4F 111.250.220.252 台灣 12/11 20:55
a10141013: 覺得賴蕭/民進黨的票被分給柯盈/民眾黨6F 111.249.194.72 台灣 12/11 20:56
mark2326: 我知道你是誰了7F 42.78.156.32 台灣 12/11 20:56
a10141013: 手機比市話都少了10%以上8F 111.249.194.72 台灣 12/11 20:56
chu: https://i.imgur.com/POtyxSL.png
純市話族 柯5.5% 賴36% 真的老人殺手9F 111.71.212.59 台灣 12/11 20:56
[圖]
phantasma: 這是各家民調裡面,唯一給數據的
希望其他家民調也願意開放11F 156.146.51.81 美國 12/11 21:16

--
作者 NewYAWARA 的最新發文:
點此顯示更多發文記錄