看板 Gossiping
作者 raiderho (冷顏冷雨)
標題 Re: [新聞] 綠初選民調5家結果超整齊 民調專家當場大笑三聲
時間 Sun Jun 16 03:20:07 2019




游盈隆自詡為民調專家,但是,從他近年多次發言看來,根本就是個草包。
他在報告各種民調結果時,非常愛用折線圖表示,比如底下這張:
https://news.ltn.com.tw/news/politics/breakingnews/2678246
強硬回擊習近平 蔡英文總統聲望谷底攀升 - 政治 - 自由時報電子報
[圖]
總統蔡英文聲望已從谷底攀升,根據民調,蔡總統整體聲望在過去10幾天出現戲劇性轉變,「總統職務表現贊同率」大幅提升10個百分點,研究顯示,此次總統聲望從谷底強力反彈、絕處逢生,主要是「中國因素」或今年初中國國家主席習近平「告台灣同胞書」40週年談話及蔡總統強硬回應所造成。台灣民意基金會今舉行「內閣改組 ...

 
講難聽點,他若在大學課堂上台報告,一定會被定在台上。

游盈隆可能在民調上確實有經驗,
然而,他只有實務經驗,沒有最初等的理論知識。
他習慣的是千人初的樣本,
將這個經驗直接套入此次各民調機構皆三千人的樣本,
對真實情況的推估一定會出錯。
三千人樣本標準差大概是千人樣本標準差的六成左右,
因此,五個機構的民調數字會比「他認定的民調數字分散程度」集中。

不酸游盈隆了,但是還是要回覆一下他質疑的點。還是請出陳水扁吧:
https://www.ftvnews.com.tw/news/detail/2019614P08M1

將陳水扁的觀點具體化,配合民調數字,他的質疑是:
每一個候選人在這五家民調支持度的最大值和最小值都差異非常小,
(陳水扁說法是 2%, 事實上大概是 2.6%)
陳水扁認為這個事件發生的可能性很小,真是如此嗎?


底下討論涉及一點點學術論證,我也不想花太多心力著墨,
所以先給個簡單結論:

在正常的抽樣程序下,
「五項機構民調最高最低差距 < 2.6%」的可能性大概有六成左右 (至少都有56%),
這是大概率事件。

想用陰謀論解釋民調結果的人,提點別的論證吧。


===


正式論證:

我們只看 (蔡韓柯) 這組對比結果,因為,同時納入 (蔡韓柯) 與 (賴韓柯)
涉及投票行為的策略,需要對模型做更多假設。本篇旨不在此。
 (題外話:兩組投票結果是高度相關的,假設策略性投票的人不多,
  若一組民調差距有限,另一組的民調差距也有限。)


假設三個人的支持度如同民進黨中央給的 (v1, v2, v3)。
 (底下的模型2 可以看到,這個假設其實不重要。)

問題:
這三個人在五項民調的最高最低差異皆不到 2.6% 的可能性。


一次實驗:
以 multinomial(3000*5, (v1, v2, v3, 1-v1-v2-v3)) 分配抽出「出像」結果。
若各候選人在5機構3000樣本獲得的最高與最低支持度的差距皆 < 2.6%,
稱為 True.

可能性:
進行一百萬次實驗 (一百萬個平行世界,每個世界都用同樣方式實施民調),
計算有多少個 True, 則 可能性 = True / 1000000.


模型1: 對稱考量
考量五項民調都不低於 (v1-0.013, v2-0.013, v3-0.013),
都不高於 (v1+0.013, v2+0.013, v3+0.013), 問可能性為何?
實驗跑出來結果約是 0.22.


模型2: 不對稱考量
放鬆考量,五項民調的上下差距不超過 2.6%,
不用拘泥於以 (v1, v2, v3) 為中心,這樣的可能性為何?
實驗結果大幅提高到 0.60.

由於模型2 不用拘泥於對稱性,
對參數的變化比模型1 更不敏感,
暗示著 (v1, v2, v3) 的「確切真實值」不是很重要,
模型2 可以避免了模型1 的真實參數估計問題,
因此是更穩健的模型。
我對模型2 在所有合理參數區間作了測試,發現可能性至少都有 0.56.


因此,目前可以初步回答,只看一組民調對比結果,在正常的抽樣程序下,
「五項機構民調最高最低差距 < 2.6%」是很可能發生的。


python code:


import numpy as np

diff = 0.013
v1, v2, v3 = 0.3508, 0.2451, 0.2270
v4 = 1 - v1 - v2 - v3
para = np.array([v1, v2, v3, v4])

lower_bound = np.array([[v1 - diff, v2 - diff, v3 - diff, 0]] * 5)
upper_bound = np.array([[v1 + diff, v2 + diff, v3 + diff, 1]] * 5)

round = 1000000
sample_size = 3000
agency = 5


''' model 1: symmetric '''

result_1 = 0

for i in range(round):
    poll = np.random.multinomial(sample_size, para, agency) / sample_size
    q = np.all(np.greater_equal(poll, lower_bound)) *
np.all(np.less_equal(poll, upper_bound))
    result_1 += q

prob_1 = result_1 / round  # prob_1 is around 0.22


''' model 2: asymmetric '''

result_2 = 0
dist = 2 * diff

for i in range(round):
    poll = np.random.multinomial(sample_size, para, agency) / sample_size
    q = np.all((np.ptp(poll, axis = 0)) < dist)
    result_2 += q

prob_2 = result_2 / round  # prob_2 is around 0.60


''' update '''
專門測試模型2 合理參數空間中,事件發生最低可能性的程式碼(要另外執行):

import numpy as np
import time

def poll_check(para, diff, round, sample_size, agency):
    result = 0
    for i in range(round):
        poll = np.random.multinomial(sample_size, para, agency) / sample_size
        q = np.all((np.ptp(poll, axis = 0)) < diff)
        result += q
    return result / round

diff = 0.026
round = 10000

prob_list = []

start = time.time()

for v3 in np.arange(0.2, 0.285, 0.005):
    for v2 in np.arange(v3, 0.335, 0.005):
        for v1 in np.arange(v2, 0.385, 0.005):
            v4 = 1 - v1 - v2 - v3
            para = np.array([v1, v2, v3, v4])
            prob = poll_check(para, diff, round, sample_size = 3000, agency =
5)
            prob_list.append(prob)

end = time.time()
print(end - start)

prob_min = min(prob_list)  # prob_min is slightly above 0.56


--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.136.235.98 (臺灣)
※ 文章代碼(AID): #1T1KJhKc (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1560626411.A.526.html
※ 同主題文章:
Re: [新聞] 綠初選民調5家結果超整齊 民調專家當場大笑三聲
06-16 03:20 raiderho.
m21423: 陳醫師不是用F-TEST打臉民進黨了嗎1F 36.229.150.250 台灣 06/16 03:21
歡迎你講出 (或查到) 用 F-test 檢測民調結果的具體步驟,我也想知道唷。
userpeter:2F 180.177.56.101 台灣 06/16 03:23
taoyang0602: 猛3F 49.215.236.121 台灣 06/16 03:25
watashiD: ...J個4F 220.141.124.66 台灣 06/16 03:25
molln: 太晚了啦5F 223.137.23.240 台灣 06/16 03:25
abduraff: 推6F 150.116.31.50 台灣 06/16 03:27
seazure2016: 原來用折線圖的就是他喔 一直不知道酸折線圖是在酸誰7F 111.83.205.224 台灣 06/16 03:28
maxmaster: 這不推人家以為我們不懂9F 201.217.58.179 巴拉圭 06/16 03:29
urgrandpa: 嗯, 跟我想的一樣10F 172.58.102.141 美國 06/16 03:32
facefear: 吳董:抽樣母體為DDP黨部提供   11F 122.146.69.104 台灣 06/16 03:32
watashiD: 先承認我只讀過工程機率,不熟統計12F 220.141.124.66 台灣 06/16 03:32
facefear: 為官位不擇手段13F 122.146.69.104 台灣 06/16 03:32
D600dust: 為什麼我學統計不用寫程式 你念什麼系14F 1.171.201.73 台灣 06/16 03:37
你是統計系的,最好要會寫 R 或 Python 啊。
spirit119: 時間太晚15F 1.200.44.111 台灣 06/16 03:40
NODINO: 我就知道是這樣16F 1.161.235.60 台灣 06/16 03:41
j1300000: 推 比一堆靠感覺的民調專家有料多了17F 1.164.15.181 台灣 06/16 03:42
julia66: 懷疑游看得懂這篇18F 1.168.0.208 台灣 06/16 03:44
joseph40: 趕快推不然別人笑我看不懂19F 111.71.31.146 台灣 06/16 03:45
maxmaster: 嗯, 跟我想的一樣20F 201.217.58.179 巴拉圭 06/16 03:45
winstonuno: 推21F 223.137.154.114 台灣 06/16 03:46
cospergod: 英粉又要出征了22F 110.26.5.215 台灣 06/16 03:47
cerberi: 統計讓我很頭痛 先推再說23F 42.70.138.166 台灣 06/16 03:47
lanx105: 你是1450ㄛ24F 119.14.114.237 台灣 06/16 03:49
請告訴我去哪裡領錢。
maxmaster: 喔喔25F 201.217.58.179 巴拉圭 06/16 03:51
Bosco: 折線圖...26F 24.18.146.176 美國 06/16 03:51
charlietk3: 真詳細27F 101.10.0.44 台灣 06/16 03:52
Cgace: 卓榮泰有上民視說過程,可以去看28F 42.75.238.45 台灣 06/16 03:53
tannoy: 道德低落者  投作弊小英+立委29F 218.187.102.229 台灣 06/16 03:54
Grothendieck: 英粉解說打臉柯糞30F 104.36.19.151 美國 06/16 03:54
wyverns: 15樓, 文學院的統計是背公式而已31F 114.136.231.32 台灣 06/16 03:55
LinBaoYan 
LinBaoYan: 柯糞看不懂吧32F 219.84.252.6 台灣 06/16 03:55
wyverns: 我比較疑惑的是python有對齊嗎?33F 114.136.231.32 台灣 06/16 03:56
m21423: 有吧 剛才跑可以正常執行34F 36.229.150.250 台灣 06/16 03:57
StylishTrade: 就算五家都用同樣3000個樣本35F 123.194.172.12 台灣 06/16 03:57
BlackCoal: 快推,不然人家以為我看不懂36F 114.27.112.207 台灣 06/16 03:57
StylishTrade: 一家找個流氓口音的訪員
一家找個溫柔婉約的訪員
表態率也會大大不同好嗎
問題不在取樣 問題在訪員特質好嗎37F 123.194.172.12 台灣 06/16 03:57
你的質疑適用於所有民調,乾脆說所有民調中心都不專業好了。
認真說:
我這篇屬於檢查模型的內在一致性,沒再橫生枝節討論模型的外部問題。
vladimir798: 我上學期統計學的噩夢又回來了QQ41F 1.160.25.192 台灣 06/16 03:59
soxgo: 游盈隆這種就是不知天下大勢扯綠營後腿42F 36.227.238.46 台灣 06/16 04:01
kinomon: 真專業..43F 223.138.15.243 台灣 06/16 04:01
facefear: [url=https://imgur.com/wN2Ad6q]https://i.imgur.com/wN2Ad6q.jpg[/url]44F 122.146.69.104 台灣 06/16 04:02
BlackCoal: 樓上這個觀點很好,所以民調公司會看不同訪問員收到的樣本是否一致,不一致的話還要加權45F 114.27.112.207 台灣 06/16 04:02
j2222222229: 就是作弊阿,1450怕別人講,可悲48F 49.216.230.144 台灣 06/16 04:07
hsnu1137: 我也覺得他們一堆智障在講F Test實在黑49F 111.255.10.163 台灣 06/16 04:09
jevin: 好讚的專業文  打臉所有操弄民調的政客嘴臉50F 180.217.82.171 台灣 06/16 04:09
hsnu1137: 人問號51F 111.255.10.163 台灣 06/16 04:09
OverInfinity: 無論如何支持專業討論52F 91.252.231.130 意大利 06/16 04:12
bakasensei: 敢說游盈隆是草包的必定是大草包53F 223.141.39.96 台灣 06/16 04:12
請他先拿掉「折線圖大師」這個恥辱印記,才有機會升級唷。
wahaha279: 噓空兩格,python coding style是有標54F 218.164.73.70 台灣 06/16 04:13
我是 Tab 派... 但是 Tab 派的平均薪資比較低啊。
cycutom: 游盈隆自2016沒通過DPP淡水立委初選後,有幫小英說過好話嗎?呵55F 114.137.202.160 台灣 06/16 04:14
tokyoto: 同一時間的比較又不是要看趨勢 為什麼會用折線圖?57F 36.227.129.27 台灣 06/16 04:18
EggAcme: 推一個59F 36.234.146.241 台灣 06/16 04:19
casper955033: 五毛會說你數學不好60F 42.73.239.210 台灣 06/16 04:21
domo307: 嗯 我就知道是這樣61F 42.77.94.164 台灣 06/16 04:23
fingers: 這啥小 講人話啦62F 101.13.132.53 台灣 06/16 04:23
真是抱歉,解釋得不夠清楚,但是我也沒多少心力多作解釋了,
畢竟我只得一次性的批幣,沒有拿現金。
aborwang: 推63F 223.139.99.119 台灣 06/16 04:23
momocom: 他就基督教系統,恨死同婚64F 95.90.187.105 德國 06/16 04:29
GaryMatthews: 呵呵 不懂統計的虎爛名嘴65F 205.154.255.162 美國 06/16 04:31
cute9527: 所以初選完記者問柯,柯還說有沒有懂統計學的,66F 118.166.59.70 台灣 06/16 04:34
octangus07: 推68F 110.28.192.219 台灣 06/16 04:38
louis82828: 嗯嗯 跟我想的一樣69F 49.215.131.243 台灣 06/16 04:39
powder5566: 你不要那麼專業好不好70F 1.200.48.236 台灣 06/16 04:40
revera1992: 廢話那麼多,之後就被打回原形了再來看笑話71F 113.196.145.132 台灣 06/16 04:43
tannoy: 過兩天新民調出來   就知道可笑惹
再作弊啊  XDD73F 218.187.102.229 台灣 06/16 04:47
righthandcat: 認真文 但很多人還是噓你幫拍拍75F 107.242.120.53 美國 06/16 04:48
謝謝。我比較關心錯漏字,錯漏字改完,就能收工囉。
thepstar: 懂統計的 應該都知道是做假 怎可能這種差距 用這種圖解說無意義76F 108.7.2.178 美國 06/16 04:50
raiderho: 請樓上懂統計的發表高見78F 114.35.73.213 台灣 06/16 04:53
iwait: 推79F 117.19.144.174 台灣 06/16 04:54
bloodyiris: 看不懂 麻瓜80F 49.215.193.41 台灣 06/16 04:59
lycs0908: 剛修完生物統計   跟我所見略同81F 49.217.76.134 台灣 06/16 05:01
YU0158: 太長了啦 請濃縮成20個字以內謝謝82F 42.74.213.79 台灣 06/16 05:18
joe59491: 我覺得頂多就是嘴母體有問題比較合理
數字接近才會是合理民調分布機率的高點83F 122.116.29.29 台灣 06/16 05:27
DFTT: 幹 看到那張折線圖就笑了
國中生都不會這麼蠢85F 114.36.139.174 台灣 06/16 05:29
nzj: 趨勢圖才會用折線圖87F 223.138.12.250 台灣 06/16 05:38
tbmh2003: 游盈在花蓮選好多次88F 114.137.162.76 台灣 06/16 05:39
viewpoint54: 推89F 111.248.245.81 台灣 06/16 05:39
pichia: 推90F 111.71.34.47 台灣 06/16 05:39
mimimoumou: 推~但愛說作弊的人一樣不會認真看
折線圖是看趨勢,比例分布通常用圓餅圖這個不用學過統計,有點基本常識的人都知道,堂堂大學教授如此程度實在很可怕91F 49.219.180.41 台灣 06/16 05:40
march315: 推95F 108.84.157.167 美國 06/16 05:47
vlin6688: 推96F 36.230.94.52 台灣 06/16 05:59
Qcloud: 專業97F 1.169.241.7 台灣 06/16 06:00
xxxg00w0: 剛那折線圖點開…呃…好吧…囧98F 111.82.37.216 台灣 06/16 06:10
maxmaster: 喔喔99F 201.217.58.179 巴拉圭 06/16 06:13
beinggood: 推306F 220.132.216.239 台灣 06/16 09:47
fashionvino: 推......307F 61.224.5.76 台灣 06/16 09:50
maykizuki: 推推308F 111.71.14.107 台灣 06/16 09:51
damnche: 你這太專業 9.2不會看309F 101.9.32.75 台灣 06/16 09:52
rishadan: 推 專業文310F 114.36.19.250 台灣 06/16 09:53

--
--
(raiderho.): Re: [新聞] 綠初選民調5家結果超整齊 民調專家當場大笑三聲 - Gossiping板