看板 HatePolitics作者 a2379928 ()標題 [討論] 其實朱立倫對統計誤差的說法也有錯時間 Sun Nov 19 01:22:58 2023
今天看到朱立倫在講,民調統計誤差內都是侯贏,所以如果民調誤差是3%,那正負3%都是
侯贏,所以柯民調要贏6%以上才算贏。
今天一直覺得這個說法哪裡奇怪,現在終於發現問題所在。
就是一般我們指的正負3%,是指同一份民調內不同候選人的支持度,也就是調查的因素應
該是彼此獨立的。比如說如果一份民調同時調查賴,柯,侯的支持度。那比較柯侯的支持
度正負3%就有意義,因為這些支持者彼此間是不重疊的。
但今天如果是做互比式民調,就算只做1vs1。也就是侯vs賴,對柯vs賴,單純看侯柯誰的
支持度比較高,就不能說把侯+3%,柯-3%當統計誤差範圍,因為這是兩個不同的調查,網
路上已經有人張貼,這樣的狀況應該怎麼算誤差
https://i.imgur.com/6GC9HSq.jpg
也就是若兩個民調都是誤差正負3%,那柯-侯的民調誤差在正負4.24%。(也就是柯如果贏
過侯4.24%,其實就算顯著了)。所以絕對不是單純正負3%來算。
這裡只是談互比式民調,至於柯這邊想採用的是對比式民調,也就是跟賴蕭的差距來決定
誰是否勝出,這種狀況其實誤差只會更縮小。
更麻煩的是,這次採用的是侯柯vs賴蕭,以及柯侯vs賴蕭。其實侯柯跟柯侯之間的支持者
是有高度相關,這種狀況更不可能誤差是正負3%這樣計算這麼簡單。
結論:其實若以4.24%做為顯著差異,其實對比式民調(就是差距的差距那欄)就是3:3
了。更別提4.24%是以侯,柯單獨跟賴比較算互比式民調的算法。如果是算差距的差距誤
差應該會更小,而且調查是侯柯和柯侯這樣搭配比較,這些誤差應該還要加上支持者之間
的相關性做修正,這樣更麻煩了。
https://i.imgur.com/h0iyrKV.jpg
--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 112.78.84.4 (臺灣)
※ 作者: a2379928 2023-11-19 01:22:58
※ 文章代碼(AID): #1bMFBqnb (HatePolitics)
※ 文章網址: https://www.ptt.cc/bbs/HatePolitics/M.1700328180.A.C65.html
※ 編輯: a2379928 (112.78.84.4 臺灣), 11/19/2023 01:24:27
推 ssaw5166: 兩邊都翻桌了算這些沒用啦1F 125.224.207.103 台灣 11/19 01:24
推 jacklyl: 其實大家都很清楚根本沒這種比法,只是在找相罵本而已。而叫人讓6%這個相罵本戰力比較高所以輿論贏了2F 106.64.121.105 台灣 11/19 01:25
推 h129875230: 你這正解 賴的母群體 互比高度相關怎麼可能是 正負三5F 223.136.114.156 台灣 11/19 01:28
→ jerry810113: 樓上正解
哭喔被插隊7F 49.217.204.83 台灣 11/19 01:28
推 Hahafan: 用合成算法 柯侯誤差範圍是4.24*2=8.48在一份樣本裡面比,誤差3%,雙方差距6%9F 1.164.14.21 台灣 11/19 01:29
→ Amulet1: 他們會跟你說正負4.24 讓你一點算你8%11F 118.160.161.28 台灣 11/19 01:31
→ Heyer: 蔡正元說差距的差距 誤差會非常小 柯會贏12F 180.218.17.181 台灣 11/19 01:31
推 Leeheaven: 朱的說法都是多餘 藍營已經看到侯原始民調連內參都輸13F 111.246.158.106 台灣 11/19 01:31
→ yoyun10121: 你算的誤差是第八欄A-B的誤差, 但如果15F 114.43.166.110 台灣 11/19 01:32
→ Leeheaven: 這才是最傷的16F 111.246.158.106 台灣 11/19 01:32
推 Fallenshit: 你放的ChatGPT的算法是將兩個調查視作獨立不相關17F 125.229.126.47 台灣 11/19 01:32
→ yoyun10121: 要比第七欄, 變數有四個A-B-(C-D), 所19F 114.43.166.110 台灣 11/19 01:32
→ Hahafan: 合成一份樣本,誤差4.24%,誤差範圍8.4820F 1.164.14.21 台灣 11/19 01:32
→ a2379928: H大誤解了,A-B的誤差是正負4.24%,意思就是A-B在正負4.24%以內不顯著,所以A-B超過4.24%就是超過誤差範圍了21F 112.78.84.4 台灣 11/19 01:32
→ Fallenshit: 可是侯柯 柯侯分別對上賴蕭是有相關的24F 125.229.126.47 台灣 11/19 01:33
→ yoyun10121: 以簡單算法會變兩倍, 要考慮變數非獨立的話還會更高25F 114.43.166.110 台灣 11/19 01:33
→ Hahafan: 不必管相關不相關,誤差都要乘以227F 1.164.14.21 台灣 11/19 01:33
推 sangoking: 管你他媽怎麼算 才不在乎咧 第一時間放話喊讓6%的直接錨定輿論風向才是硬實力 嘻嘻28F 203.203.60.131 台灣 11/19 01:34
→ a2379928: Fall大,沒錯呦。在兩個事件不相關的狀況下誤差都會縮小到4.24%,何況這兩個事件顯然有高度相關(就是侯柯跟柯侯的支持者),這樣誤差只會更小31F 112.78.84.4 台灣 11/19 01:34
→ Amulet1: 事實上你把相關性放進來3%還多讓了lol35F 118.160.161.28 台灣 11/19 01:34
推 Fallenshit: 本來就是要多讓 讓成這樣還要賴皮OMG36F 125.229.126.47 台灣 11/19 01:35
→ sangoking: 一份民調藍白各自解讀 484跟92共屎87%像 嘻嘻37F 203.203.60.131 台灣 11/19 01:35
推 chx64: 你要是做一對一民調那叫做分手民調沒有要合39F 175.182.207.25 台灣 11/19 01:36
→ Hahafan: 喔喔 我知道了 感謝40F 1.164.14.21 台灣 11/19 01:36
→ a2379928: Hal大,不是什麼都要乘2好嗎?今天就是把A-B當成一個東西了,意思就是A-B超過4.24%就是超過誤差範圍。41F 112.78.84.4 台灣 11/19 01:37
推 Blue24581: 推推44F 114.137.91.61 台灣 11/19 01:39
→ yoyun10121: 你今天要比差距的差距, 四個變數都有誤差, 合成後簡單算的確誤差要乘兩倍認真點算因為(1)和(2), 是機率有相關一個是p, 一個是1-p, 所以光(1)-(2)誤差合成後就兩倍, (3)-(4)一樣也是兩倍45F 114.43.166.110 台灣 11/19 01:39
推 Hahafan: 不過原PO應該也有想到,柯賴差距之間也要50F 1.164.14.21 台灣 11/19 01:41
→ yoyun10121: 差距的差距(1)-(2)-(3)+(4)=乘2.8倍..51F 114.43.166.110 台灣 11/19 01:42
→ Hahafan: 算誤差,侯賴也是,不是直接相減吧52F 1.164.14.21 台灣 11/19 01:42
→ yoyun10121: 所以你真要看差距的差距, 誤差是8.4%結果是5:1侯贏53F 114.43.166.110 台灣 11/19 01:42
推 Fallenshit: 媽的笑死 怎麼還有人不懂互比跟對比民調的定義在這邊大談阿55F 125.229.126.47 台灣 11/19 01:44
推 Hahafan: 對比的誤差乘以2,互比乘以sqrt(2)57F 1.164.14.21 台灣 11/19 01:45
推 formice: 其實我是相信專業的,不要一直把別人當壞人,好歹也是會計學系教授。 到底一次臭了幾個...58F 1.200.119.47 台灣 11/19 01:47
推 henrywinwin: 師傅說不要把別人想的那麼壞欸61F 218.173.135.99 台灣 11/19 01:47
→ yoyun10121: 7那個天才算法就是先算對比再算互比,62F 114.43.166.110 台灣 11/19 01:48
→ Hahafan: 柯賴誤差6%,侯賴誤差6%,柯侯誤差4.24%63F 1.164.14.21 台灣 11/19 01:48
→ yoyun10121: 誤差疊起來就2qrt(2)突破天際64F 114.43.166.110 台灣 11/19 01:48
推 qpeter: 現在已經不是讓幾趴的問題了 現在是
TMD主張看數據(7) KMT主張看數據(8)
兩邊連採取的"數據根據"都談不攏了...65F 36.225.103.200 台灣 11/19 01:49
推 jackypan1989: H的數學真的要回去重修…68F 114.36.183.11 台灣 11/19 01:49
→ yoyun10121: 有算誤差的話, 不管用(7)還(8)都侯贏69F 114.43.166.110 台灣 11/19 01:50
推 hsuchengchun: 沒錯 朱的誤差算法是錯的70F 114.137.104.107 台灣 11/19 01:53
推 Hahafan: 原PO應該要解釋柯賴之間為什麼就不算誤差71F 1.164.14.21 台灣 11/19 01:53
推 jackypan1989: 相關性高的只會讓誤差更小
那種直接加的,拜託去唸個大學好嗎72F 114.36.183.11 台灣 11/19 01:54
→ yoyun10121: 原PO就沒搞懂, (7)根本不是A-B, 怎麼會只拿A-B的合成誤差來比74F 114.43.166.110 台灣 11/19 01:54
推 hsuchengchun: 差距的差距不是用隨機誤差76F 114.137.104.107 台灣 11/19 01:55
→ Hahafan: y大是對的,既然要算誤差,全都要算進去77F 1.164.14.21 台灣 11/19 01:55
→ EDFR: 怎麼計算其實都沒差啦, 重點是不看誤差侯幾乎都輸怎麼服眾78F 219.71.113.43 台灣 11/19 01:55
推 Hahafan: 假設柯30,賴35,兩者差距最大是38-27=11(7)的算法沒有考慮一份民調內的誤差80F 1.164.14.21 台灣 11/19 01:58
推 ecejc: 誤差全都考慮進來一樣最後根本 3% 都不必讓
我先直接給公式
假設柯侯和侯柯的相關性是 Alpha (+1 到 -1 之間)
柯侯(或侯柯)和賴蕭的相關性是 Beta (+1 到 -1 之間)
誤差值的平方是 sigma
那麼對比之後的誤差會是 (4 * [ 2 - (Alpha - Beta)] * sigma)開根號
如果 Alpha 是 0.9 (會投柯侯的幾乎都投侯柯),Beta 是 -0.9 (投賴的幾乎不投柯或侯)
那麼誤差變成 (4*0.2*sigma) 開根號
誤差值會剩下 = 0.89 倍
如果 Alpha 和 Beta 各是 0.8 和 -0.8
誤差值則會變 = 1.26 倍82F 122.116.74.16 台灣 11/19 02:12
推 Fallenshit: 笑死 照你說法 柯對比賴 賴取最大誤差猴對比賴 賴取最小誤差 贏麻了 哈哈沒有你H這種算法啦 拜託99F 125.229.126.47 台灣 11/19 02:12
推 ecejc: 如果朱侯還死咬統計誤差 那就讓民調公司
給出上述的相關性參數
我保證最後一定是朱侯自打臉
甚致直接柯4侯2102F 122.116.74.16 台灣 11/19 02:15
推 ppdadader: 因該立法11/18為台灣統計日 以後要放假106F 114.137.59.176 台灣 11/19 02:18
推 Hahafan: 同理,也沒有p1-p2求sigma的算法,必須回因為又要重新考慮相關性求變異數108F 1.164.14.21 台灣 11/19 02:18
推 ecejc: 樓上是不是看不懂我們在算什麼 你講的這些110F 122.116.74.16 台灣 11/19 02:21
推 Fallenshit: 到底在講什麼...111F 125.229.126.47 台灣 11/19 02:21
→ ecejc: 有raw data都算得出啦 還扯什麼沒算法112F 122.116.74.16 台灣 11/19 02:21
推 Hahafan: 所以就不能用(7)的算法,憑甚麼對比式
不用考慮誤差,互比就要考慮誤差113F 1.164.14.21 台灣 11/19 02:23
→ ecejc: 樓上果然看不懂 我的算法就把所有誤差全算115F 122.116.74.16 台灣 11/19 02:24
推 Fallenshit: 哪裡講了對比不考慮誤差?原PO文章你有看?116F 125.229.126.47 台灣 11/19 02:24
→ Hahafan: 網路上最新的Mcnemar似乎可以解決問題118F 1.164.14.21 台灣 11/19 02:24
→ ecejc: 還在扯沒考慮誤差119F 122.116.74.16 台灣 11/19 02:24
→ Hahafan: 但是不能確定一通電話一定問兩個問題120F 1.164.14.21 台灣 11/19 02:25
推 Fallenshit: 來抬槓的喔...你連民調公司都不信了121F 125.229.126.47 台灣 11/19 02:26
→ Hahafan: (7)的算法中有賴柯差距這一項,應考慮誤122F 1.164.14.21 台灣 11/19 02:26
→ Fallenshit: 那還看他數字幹嘛?題型這種東西也要質疑?123F 125.229.126.47 台灣 11/19 02:26
→ Hahafan: 受訪者答一個問題,拒答另一個問題
民眾黨算法是各自民調與賴相減再比較125F 1.164.14.21 台灣 11/19 02:27
推 elfish123: 這邊一堆文組最好看得懂,搞不好很多私立學店的127F 111.82.180.71 台灣 11/19 02:30
→ Hahafan: 相減這部分不考慮誤差,互比就考慮誤差129F 1.164.14.21 台灣 11/19 02:30
推 Fallenshit: 你真的看不懂ㄟ 相減有考慮誤差阿
這邊誰跟你說不考慮誤差了?130F 125.229.126.47 台灣 11/19 02:31
→ Hahafan: 你誤差全部都考慮進去過大沒錯,但不能132F 1.164.14.21 台灣 11/19 02:31
→ Fallenshit: 只是誤差怎麼算大家有不同看法阿133F 125.229.126.47 台灣 11/19 02:31
→ Hahafan: 我在回答e大問題
既然大家都有不同看法,我認為要考慮誤差134F 1.164.14.21 台灣 11/19 02:31
→ Fallenshit: 他不是跟你寫算式了?那就是她認為的誤差阿136F 125.229.126.47 台灣 11/19 02:32
→ Hahafan: 互比只有考慮sqrt(3%+3%)一個誤差138F 1.164.14.21 台灣 11/19 02:33
→ Fallenshit: 你說別人沒考慮誤差是怎樣?139F 125.229.126.47 台灣 11/19 02:33
→ Hahafan: 柯賴相減的誤差就沒有考慮到140F 1.164.14.21 台灣 11/19 02:33
推 ecejc: 我的公式有考慮相減的誤差啦 只是你沒看懂141F 122.116.74.16 台灣 11/19 02:33
→ Hahafan: e大考慮所有誤差,誤差過大,所以他說不不能因為誤差大就不考慮,有別的算法142F 1.164.14.21 台灣 11/19 02:34
推 Fallenshit: 什麼叫做有別的算法?共變數你懂嗎?不懂的人真的要在這裡大談?144F 125.229.126.47 台灣 11/19 02:35
推 Hahafan: e大算的誤差還是用互比的算法,並非對比我之前沒看清楚,我以為有考慮進去
他把柯賴、侯柯、侯賴當作同等地位146F 1.164.14.21 台灣 11/19 02:41
推 Fallenshit: 你先告訴我sqrt(3%+3%)是多少好不好..你自己打的喔 我可沒賴你149F 125.229.126.47 台灣 11/19 02:42
→ Hahafan: 所以直接用相關係數下去算,相減不一定可根號(3%+3%)是還沒有考慮到相減151F 1.164.14.21 台灣 11/19 02:43
推 Fallenshit: 我問你數字 你在那扯東扯西153F 125.229.126.47 台灣 11/19 02:44
→ Hahafan: 考慮相減,最極端的值是sqrt(6%+6%)154F 1.164.14.21 台灣 11/19 02:45
→ Fallenshit: 所以數字是多少啊?
聽聽看有沒有道理啊
阿 真無趣 烙跑惹ㄇ
正黑數學天才...155F 125.229.126.47 台灣 11/19 02:45
推 Hahafan: 我已經寫了啊,(7)的誤差沒有公式可用159F 1.164.14.21 台灣 11/19 02:51
推 Fallenshit: 我問你sqrt(3%+3%)數字是多少啦!160F 125.229.126.47 台灣 11/19 02:52
→ Hahafan: McNemar's test 的公式要確保有配對樣本161F 1.164.14.21 台灣 11/19 02:52
→ Fallenshit: 我問你sqrt(3%+3%)數字是多少啦!
拜託 回答一下很難嗎..162F 125.229.126.47 台灣 11/19 02:52
推 howhowhaha: Fall大妳幹嘛跟他認真啊164F 36.230.120.166 台灣 11/19 02:54
推 Hahafan: sqrt(6%^2+6%^2)=6.36%165F 1.164.14.21 台灣 11/19 02:55
→ howhowhaha: 這個人看起來就是上網找一堆自己也看不懂的名詞貼上來
搞得好像自己很專業,笑死狂跳針
真的是為了讓侯侯贏什麼下限都可以不管欸166F 36.230.120.166 台灣 11/19 02:55
推 Fallenshit: 終於發現公式亂套惹 嘻171F 125.229.126.47 台灣 11/19 02:56
→ howhowhaha: 深綠侯粉172F 36.230.120.166 台灣 11/19 02:56
→ Fallenshit: 我要笑死了 哈哈哈
才剛學會的公式不要硬亂用啦 吼173F 125.229.126.47 台灣 11/19 02:56
→ ryan9527: 跌破大家眼鏡及摜破藍營人士的底氣不是在吵誤差範圍,而是原本以為各拿一份內參民調,在取讓分前會是1:1開局,卻沒想到連藍營拿出來的侯柯還輸,支持者們若不懂還算正常,可是藍營的黨公職跟民代要怎麼在未來2個月內護航下去176F 122.100.71.121 台灣 11/19 05:54
--