Re: [新聞] 綠初選民調5家結果超整齊民調專家當場大笑三聲 - Gossiping板

看板 Gossiping
作者 raiderho (冷顏冷雨)
標題 Re: [新聞] 綠初選民調5家結果超整齊民調專家當場大笑三聲
時間 Sun Jun 16 03:20:07 2019

游盈隆自詡為民調專家，但是，從他近年多次發言看來，根本就是個草包。
他在報告各種民調結果時，非常愛用折線圖表示，比如底下這張：
https://news.ltn.com.tw/news/politics/breakingnews/2678246

強硬回擊習近平蔡英文總統聲望谷底攀升 - 政治 - 自由時報電子報

總統蔡英文聲望已從谷底攀升，根據民調，蔡總統整體聲望在過去10幾天出現戲劇性轉變，「總統職務表現贊同率」大幅提升10個百分點，研究顯示，此次總統聲望從谷底強力反彈、絕處逢生，主要是「中國因素」或今年初中國國家主席習近平「告台灣同胞書」40週年談話及蔡總統強硬回應所造成。台灣民意基金會今舉行「內閣改組 ...

講難聽點，他若在大學課堂上台報告，一定會被定在台上。

游盈隆可能在民調上確實有經驗，
然而，他只有實務經驗，沒有最初等的理論知識。
他習慣的是千人初的樣本，
將這個經驗直接套入此次各民調機構皆三千人的樣本，
對真實情況的推估一定會出錯。
三千人樣本標準差大概是千人樣本標準差的六成左右，
因此，五個機構的民調數字會比「他認定的民調數字分散程度」集中。

不酸游盈隆了，但是還是要回覆一下他質疑的點。還是請出陳水扁吧：
https://www.ftvnews.com.tw/news/detail/2019614P08M1

將陳水扁的觀點具體化，配合民調數字，他的質疑是：
每一個候選人在這五家民調支持度的最大值和最小值都差異非常小，
(陳水扁說法是 2%, 事實上大概是 2.6%)
陳水扁認為這個事件發生的可能性很小，真是如此嗎？

底下討論涉及一點點學術論證，我也不想花太多心力著墨，
所以先給個簡單結論：

在正常的抽樣程序下，
「五項機構民調最高最低差距 < 2.6%」的可能性大概有六成左右 (至少都有56%)，
這是大概率事件。

想用陰謀論解釋民調結果的人，提點別的論證吧。

===

正式論證：

我們只看 (蔡韓柯) 這組對比結果，因為，同時納入 (蔡韓柯) 與 (賴韓柯)
涉及投票行為的策略，需要對模型做更多假設。本篇旨不在此。
(題外話：兩組投票結果是高度相關的，假設策略性投票的人不多，
若一組民調差距有限，另一組的民調差距也有限。)

假設三個人的支持度如同民進黨中央給的 (v1, v2, v3)。
(底下的模型2 可以看到，這個假設其實不重要。)

問題：
這三個人在五項民調的最高最低差異皆不到 2.6% 的可能性。

一次實驗:
以 multinomial(3000*5, (v1, v2, v3, 1-v1-v2-v3)) 分配抽出「出像」結果。
若各候選人在5機構3000樣本獲得的最高與最低支持度的差距皆 < 2.6%，
稱為 True.

可能性:
進行一百萬次實驗 (一百萬個平行世界，每個世界都用同樣方式實施民調)，
計算有多少個 True, 則可能性 = True / 1000000.

模型1: 對稱考量
考量五項民調都不低於 (v1-0.013, v2-0.013, v3-0.013),
都不高於 (v1+0.013, v2+0.013, v3+0.013), 問可能性為何？
實驗跑出來結果約是 0.22.

模型2: 不對稱考量
放鬆考量，五項民調的上下差距不超過 2.6%,
不用拘泥於以 (v1, v2, v3) 為中心，這樣的可能性為何？
實驗結果大幅提高到 0.60.

由於模型2 不用拘泥於對稱性，
對參數的變化比模型1 更不敏感，
暗示著 (v1, v2, v3) 的「確切真實值」不是很重要，
模型2 可以避免了模型1 的真實參數估計問題，
因此是更穩健的模型。
我對模型2 在所有合理參數區間作了測試，發現可能性至少都有 0.56.

因此，目前可以初步回答，只看一組民調對比結果，在正常的抽樣程序下，
「五項機構民調最高最低差距 < 2.6%」是很可能發生的。

python code:

import numpy as np

diff = 0.013
v1, v2, v3 = 0.3508, 0.2451, 0.2270

v4 = 1 - v1 - v2 - v3

para = np.array([v1, v2, v3, v4])

lower_bound = np.array([[v1 - diff, v2 - diff, v3 - diff, 0]] * 5)
upper_bound = np.array([[v1 + diff, v2 + diff, v3 + diff, 1]] * 5)

round = 1000000
sample_size = 3000
agency = 5

''' model 1: symmetric '''

result_1 = 0

for i in range(round):
poll = np.random.multinomial(sample_size, para, agency) / sample_size
q = np.all(np.greater_equal(poll, lower_bound)) *
np.all(np.less_equal(poll, upper_bound))
result_1 += q

prob_1 = result_1 / round # prob_1 is around 0.22

''' model 2: asymmetric '''

result_2 = 0
dist = 2 * diff

for i in range(round):
poll = np.random.multinomial(sample_size, para, agency) / sample_size
q = np.all((np.ptp(poll, axis = 0)) < dist)
result_2 += q

prob_2 = result_2 / round # prob_2 is around 0.60

''' update '''
專門測試模型2 合理參數空間中，事件發生最低可能性的程式碼（要另外執行）:

import numpy as np
import time

def poll_check(para, diff, round, sample_size, agency):
result = 0
for i in range(round):
poll = np.random.multinomial(sample_size, para, agency) / sample_size
q = np.all((np.ptp(poll, axis = 0)) < diff)
result += q
return result / round

diff = 0.026
round = 10000

prob_list = []

start = time.time()

for v3 in np.arange(0.2, 0.285, 0.005):
for v2 in np.arange(v3, 0.335, 0.005):
for v1 in np.arange(v2, 0.385, 0.005):

v4 = 1 - v1 - v2 - v3

para = np.array([v1, v2, v3, v4])

prob = poll_check(para, diff, round, sample_size = 3000, agency =
5)

prob_list.append(prob)

end = time.time()
print(end - start)

prob_min = min(prob_list) # prob_min is slightly above 0.56

--

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.136.235.98 (臺灣)
※ 文章代碼(AID): #1T1KJhKc (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1560626411.A.526.html

※ 同主題文章:

[新聞] 綠初選民調5家結果超整齊民調專家當場大笑三聲

06-14 16:28 blueadam193.

Re: [新聞] 綠初選民調5家結果超整齊民調專家當場大笑三聲

06-16 03:20 raiderho.

Re: [新聞] 綠初選民調5家結果超整齊民調專家當場

06-16 05:51 ERT312.

噓 m21423: 陳醫師不是用F-TEST打臉民進黨了嗎1F 36.229.150.250 台灣 06/16 03:21

歡迎你講出 (或查到) 用 F-test 檢測民調結果的具體步驟，我也想知道唷。

推 userpeter:2F 180.177.56.101 台灣 06/16 03:23

推 taoyang0602: 猛3F 49.215.236.121 台灣 06/16 03:25

推 watashiD: ...J個4F 220.141.124.66 台灣 06/16 03:25

推 molln: 太晚了啦5F 223.137.23.240 台灣 06/16 03:25

推 abduraff: 推6F 150.116.31.50 台灣 06/16 03:27

推 seazure2016: 原來用折線圖的就是他喔一直不知道酸折線圖是在酸誰7F 111.83.205.224 台灣 06/16 03:28

→ maxmaster: 這不推人家以為我們不懂9F 201.217.58.179 巴拉圭 06/16 03:29

推 urgrandpa: 嗯, 跟我想的一樣10F 172.58.102.141 美國 06/16 03:32

噓 facefear: 吳董:抽樣母體為ＤＤＰ黨部提供　　　11F 122.146.69.104 台灣 06/16 03:32

推 watashiD: 先承認我只讀過工程機率,不熟統計12F 220.141.124.66 台灣 06/16 03:32

→ facefear: 為官位不擇手段13F 122.146.69.104 台灣 06/16 03:32

推 D600dust: 為什麼我學統計不用寫程式你念什麼系14F 1.171.201.73 台灣 06/16 03:37

你是統計系的，最好要會寫 R 或 Python 啊。

推 spirit119: 時間太晚15F 1.200.44.111 台灣 06/16 03:40

推 NODINO: 我就知道是這樣16F 1.161.235.60 台灣 06/16 03:41

推 j1300000: 推比一堆靠感覺的民調專家有料多了17F 1.164.15.181 台灣 06/16 03:42

推 julia66: 懷疑游看得懂這篇18F 1.168.0.208 台灣 06/16 03:44

推 joseph40: 趕快推不然別人笑我看不懂19F 111.71.31.146 台灣 06/16 03:45

推 maxmaster: 嗯, 跟我想的一樣20F 201.217.58.179 巴拉圭 06/16 03:45

推 winstonuno: 推21F 223.137.154.114 台灣 06/16 03:46

噓 cospergod: 英粉又要出征了22F 110.26.5.215 台灣 06/16 03:47

推 cerberi: 統計讓我很頭痛先推再說23F 42.70.138.166 台灣 06/16 03:47

推 lanx105: 你是1450ㄛ24F 119.14.114.237 台灣 06/16 03:49

請告訴我去哪裡領錢。

推 maxmaster: 喔喔25F 201.217.58.179 巴拉圭 06/16 03:51

推 Bosco: 折線圖...26F 24.18.146.176 美國 06/16 03:51

推 charlietk3: 真詳細27F 101.10.0.44 台灣 06/16 03:52

推 Cgace: 卓榮泰有上民視說過程，可以去看28F 42.75.238.45 台灣 06/16 03:53

推 tannoy: 道德低落者投作弊小英＋立委29F 218.187.102.229 台灣 06/16 03:54

推 Grothendieck: 英粉解說打臉柯糞30F 104.36.19.151 美國 06/16 03:54

推 wyverns: 15樓, 文學院的統計是背公式而已31F 114.136.231.32 台灣 06/16 03:55

→ LinBaoYan …

→ wyverns: 我比較疑惑的是python有對齊嗎？33F 114.136.231.32 台灣 06/16 03:56

推 m21423: 有吧剛才跑可以正常執行34F 36.229.150.250 台灣 06/16 03:57

推 StylishTrade: 就算五家都用同樣3000個樣本35F 123.194.172.12 台灣 06/16 03:57

推 BlackCoal: 快推，不然人家以為我看不懂36F 114.27.112.207 台灣 06/16 03:57

→ StylishTrade: 一家找個流氓口音的訪員
一家找個溫柔婉約的訪員
表態率也會大大不同好嗎
問題不在取樣問題在訪員特質好嗎37F 123.194.172.12 台灣 06/16 03:57

你的質疑適用於所有民調，乾脆說所有民調中心都不專業好了。
認真說：
我這篇屬於檢查模型的內在一致性，沒再橫生枝節討論模型的外部問題。

推 vladimir798: 我上學期統計學的噩夢又回來了QQ41F 1.160.25.192 台灣 06/16 03:59

推 soxgo: 游盈隆這種就是不知天下大勢扯綠營後腿42F 36.227.238.46 台灣 06/16 04:01

推 kinomon: 真專業..43F 223.138.15.243 台灣 06/16 04:01

→ facefear: [url=https://imgur.com/wN2Ad6q]https://i.imgur.com/wN2Ad6q.jpg[/url]44F 122.146.69.104 台灣 06/16 04:02

推 BlackCoal: 樓上這個觀點很好，所以民調公司會看不同訪問員收到的樣本是否一致，不一致的話還要加權45F 114.27.112.207 台灣 06/16 04:02

推 j2222222229: 就是作弊阿，1450怕別人講，可悲48F 49.216.230.144 台灣 06/16 04:07

推 hsnu1137: 我也覺得他們一堆智障在講F Test實在黑49F 111.255.10.163 台灣 06/16 04:09

推 jevin: 好讚的專業文打臉所有操弄民調的政客嘴臉50F 180.217.82.171 台灣 06/16 04:09

→ hsnu1137: 人問號51F 111.255.10.163 台灣 06/16 04:09

推 OverInfinity: 無論如何支持專業討論52F 91.252.231.130 意大利 06/16 04:12

噓 bakasensei: 敢說游盈隆是草包的必定是大草包53F 223.141.39.96 台灣 06/16 04:12

請他先拿掉「折線圖大師」這個恥辱印記，才有機會升級唷。

噓 wahaha279: 噓空兩格，python coding style是有標54F 218.164.73.70 台灣 06/16 04:13

我是 Tab 派... 但是 Tab 派的平均薪資比較低啊。

推 cycutom: 游盈隆自2016沒通過DPP淡水立委初選後，有幫小英說過好話嗎？呵55F 114.137.202.160 台灣 06/16 04:14

推 tokyoto: 同一時間的比較又不是要看趨勢為什麼會用折線圖？57F 36.227.129.27 台灣 06/16 04:18

推 EggAcme: 推一個59F 36.234.146.241 台灣 06/16 04:19

推 casper955033: 五毛會說你數學不好60F 42.73.239.210 台灣 06/16 04:21

推 domo307: 嗯我就知道是這樣61F 42.77.94.164 台灣 06/16 04:23

推 fingers: 這啥小講人話啦62F 101.13.132.53 台灣 06/16 04:23

真是抱歉，解釋得不夠清楚，但是我也沒多少心力多作解釋了，
畢竟我只得一次性的批幣，沒有拿現金。

推 aborwang: 推63F 223.139.99.119 台灣 06/16 04:23

→ momocom: 他就基督教系統，恨死同婚64F 95.90.187.105 德國 06/16 04:29

推 GaryMatthews: 呵呵不懂統計的虎爛名嘴65F 205.154.255.162 美國 06/16 04:31

推 cute9527: 所以初選完記者問柯，柯還說有沒有懂統計學的，66F 118.166.59.70 台灣 06/16 04:34

推 octangus07: 推68F 110.28.192.219 台灣 06/16 04:38

推 louis82828: 嗯嗯跟我想的一樣69F 49.215.131.243 台灣 06/16 04:39

推 powder5566: 你不要那麼專業好不好70F 1.200.48.236 台灣 06/16 04:40

噓 revera1992: 廢話那麼多，之後就被打回原形了再來看笑話71F 113.196.145.132 台灣 06/16 04:43

→ tannoy: 過兩天新民調出來就知道可笑惹
再作弊啊 XDD73F 218.187.102.229 台灣 06/16 04:47

推 righthandcat: 認真文但很多人還是噓你幫拍拍75F 107.242.120.53 美國 06/16 04:48

謝謝。我比較關心錯漏字，錯漏字改完，就能收工囉。

推 thepstar: 懂統計的應該都知道是做假怎可能這種差距用這種圖解說無意義76F 108.7.2.178 美國 06/16 04:50

→ raiderho: 請樓上懂統計的發表高見78F 114.35.73.213 台灣 06/16 04:53

推 iwait: 推79F 117.19.144.174 台灣 06/16 04:54

推 bloodyiris: 看不懂麻瓜80F 49.215.193.41 台灣 06/16 04:59

推 lycs0908: 剛修完生物統計跟我所見略同81F 49.217.76.134 台灣 06/16 05:01

推 YU0158: 太長了啦請濃縮成20個字以內謝謝82F 42.74.213.79 台灣 06/16 05:18

推 joe59491: 我覺得頂多就是嘴母體有問題比較合理
數字接近才會是合理民調分布機率的高點83F 122.116.29.29 台灣 06/16 05:27

→ DFTT: 幹看到那張折線圖就笑了
國中生都不會這麼蠢85F 114.36.139.174 台灣 06/16 05:29

→ nzj: 趨勢圖才會用折線圖87F 223.138.12.250 台灣 06/16 05:38

推 tbmh2003: 游盈在花蓮選好多次88F 114.137.162.76 台灣 06/16 05:39

推 viewpoint54: 推89F 111.248.245.81 台灣 06/16 05:39

推 pichia: 推90F 111.71.34.47 台灣 06/16 05:39

推 mimimoumou: 推~但愛說作弊的人一樣不會認真看
折線圖是看趨勢,比例分布通常用圓餅圖這個不用學過統計,有點基本常識的人都知道,堂堂大學教授如此程度實在很可怕91F 49.219.180.41 台灣 06/16 05:40

推 march315: 推95F 108.84.157.167 美國 06/16 05:47

推 vlin6688: 推96F 36.230.94.52 台灣 06/16 05:59

推 Qcloud: 專業97F 1.169.241.7 台灣 06/16 06:00

推 xxxg00w0: 剛那折線圖點開…呃…好吧…囧98F 111.82.37.216 台灣 06/16 06:10

推 maxmaster: 喔喔99F 201.217.58.179 巴拉圭 06/16 06:13

推 beinggood: 推306F 220.132.216.239 台灣 06/16 09:47

推 fashionvino: 推......307F 61.224.5.76 台灣 06/16 09:50

推 maykizuki: 推推308F 111.71.14.107 台灣 06/16 09:51

推 damnche: 你這太專業 9.2不會看309F 101.9.32.75 台灣 06/16 09:52

推 rishadan: 推專業文310F 114.36.19.250 台灣 06/16 09:53

→
much2277

台灣 06-16 09:47
說做弊的提不出證據，只會在那邊崩潰~XD
→
sbb

台灣 06-16 10:51
民主制度不容易就是這樣，連統計都算在民主素養裏頭
→
dispgogogo

台灣 06-16 10:59
就數字是cooking出來，要多少有多少
→
coolnoss

台灣 06-16 11:16
文很專業但不信者恆不信
→
rock2015

台灣 06-16 13:32
說做弊，你也找五家，作必看看？
→
kk0816

台灣 06-16 14:14
有人就是沒事落個英文單字好像很厲害，結果根本不知所云
→
zoohoods

台灣 06-16 18:58
還在F-TEST？這只是統計方法的
一種而已，就兩同質差變數分析幹一幫傻子
以為是什麼高深的武功秘笈？
→
he02085107

台灣 06-16 19:19
推

(raiderho.): Re: [新聞] 綠初選民調5家結果超整齊民調專家當場大笑三聲 - Gossiping板