顯示廣告
隱藏 ✕
※ 本文轉寄自 ptt.cc 更新時間: 2023-11-19 06:20:31
看板 HatePolitics
作者 a2379928 ()
標題 [討論] 其實朱立倫對統計誤差的說法也有錯
時間 Sun Nov 19 01:22:58 2023


今天看到朱立倫在講,民調統計誤差內都是侯贏,所以如果民調誤差是3%,那正負3%都是
侯贏,所以柯民調要贏6%以上才算贏。

今天一直覺得這個說法哪裡奇怪,現在終於發現問題所在。

就是一般我們指的正負3%,是指同一份民調內不同候選人的支持度,也就是調查的因素應
該是彼此獨立的。比如說如果一份民調同時調查賴,柯,侯的支持度。那比較柯侯的支持
度正負3%就有意義,因為這些支持者彼此間是不重疊的。


但今天如果是做互比式民調,就算只做1vs1。也就是侯vs賴,對柯vs賴,單純看侯柯誰的
支持度比較高,就不能說把侯+3%,柯-3%當統計誤差範圍,因為這是兩個不同的調查,網
路上已經有人張貼,這樣的狀況應該怎麼算誤差

https://i.imgur.com/6GC9HSq.jpg
[圖]

也就是若兩個民調都是誤差正負3%,那柯-侯的民調誤差在正負4.24%。(也就是柯如果贏
過侯4.24%,其實就算顯著了)。所以絕對不是單純正負3%來算。

這裡只是談互比式民調,至於柯這邊想採用的是對比式民調,也就是跟賴蕭的差距來決定
誰是否勝出,這種狀況其實誤差只會更縮小。

更麻煩的是,這次採用的是侯柯vs賴蕭,以及柯侯vs賴蕭。其實侯柯跟柯侯之間的支持者
是有高度相關,這種狀況更不可能誤差是正負3%這樣計算這麼簡單。

結論:其實若以4.24%做為顯著差異,其實對比式民調(就是差距的差距那欄)就是3:3
了。更別提4.24%是以侯,柯單獨跟賴比較算互比式民調的算法。如果是算差距的差距誤
差應該會更小,而且調查是侯柯和柯侯這樣搭配比較,這些誤差應該還要加上支持者之間
的相關性做修正,這樣更麻煩了。


https://i.imgur.com/h0iyrKV.jpg
[圖]




--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 112.78.84.4 (臺灣)
※ 作者: a2379928 2023-11-19 01:22:58
※ 文章代碼(AID): #1bMFBqnb (HatePolitics)
※ 文章網址: https://www.ptt.cc/bbs/HatePolitics/M.1700328180.A.C65.html
※ 編輯: a2379928 (112.78.84.4 臺灣), 11/19/2023 01:24:27
ssaw5166: 兩邊都翻桌了算這些沒用啦1F 125.224.207.103 台灣 11/19 01:24
jacklyl: 其實大家都很清楚根本沒這種比法,只是2F 106.64.121.105 台灣 11/19 01:25
jacklyl: 在找相罵本而已。而叫人讓6%這個相罵本
jacklyl: 戰力比較高所以輿論贏了
h129875230: 你這正解 賴的母群體 互比高度相關怎5F 223.136.114.156 台灣 11/19 01:28
h129875230: 麼可能是 正負三
jerry810113: 樓上正解7F 49.217.204.83 台灣 11/19 01:28
jerry810113: 哭喔被插隊
Hahafan: 用合成算法 柯侯誤差範圍是4.24*2=8.489F 1.164.14.21 台灣 11/19 01:29
Hahafan: 在一份樣本裡面比,誤差3%,雙方差距6%
Amulet1: 他們會跟你說正負4.24 讓你一點算你8%11F 118.160.161.28 台灣 11/19 01:31
Heyer: 蔡正元說差距的差距 誤差會非常小 柯會贏12F 180.218.17.181 台灣 11/19 01:31
Leeheaven: 朱的說法都是多餘 藍營已經看到侯原始13F 111.246.158.106 台灣 11/19 01:31
Leeheaven: 民調連內參都輸
yoyun10121: 你算的誤差是第八欄A-B的誤差, 但如果15F 114.43.166.110 台灣 11/19 01:32
Leeheaven: 這才是最傷的16F 111.246.158.106 台灣 11/19 01:32
Fallenshit: 你放的ChatGPT的算法是將兩個調查視作17F 125.229.126.47 台灣 11/19 01:32
Fallenshit: 獨立不相關
yoyun10121: 要比第七欄, 變數有四個A-B-(C-D), 所19F 114.43.166.110 台灣 11/19 01:32
Hahafan: 合成一份樣本,誤差4.24%,誤差範圍8.4820F 1.164.14.21 台灣 11/19 01:32
a2379928: H大誤解了,A-B的誤差是正負4.24%,意21F 112.78.84.4 台灣 11/19 01:32
a2379928: 思就是A-B在正負4.24%以內不顯著,所以A
a2379928: -B超過4.24%就是超過誤差範圍了
Fallenshit: 可是侯柯 柯侯分別對上賴蕭是有相關的24F 125.229.126.47 台灣 11/19 01:33
yoyun10121: 以簡單算法會變兩倍, 要考慮變數非獨25F 114.43.166.110 台灣 11/19 01:33
yoyun10121: 立的話還會更高
Hahafan: 不必管相關不相關,誤差都要乘以227F 1.164.14.21 台灣 11/19 01:33
sangoking: 管你他媽怎麼算  才不在乎咧  第一時28F 203.203.60.131 台灣 11/19 01:34
sangoking: 間放話喊讓6%的直接錨定輿論風向才是硬
sangoking: 實力  嘻嘻
a2379928: Fall大,沒錯呦。在兩個事件不相關的狀31F 112.78.84.4 台灣 11/19 01:34
a2379928: 況下誤差都會縮小到4.24%,何況這兩個
a2379928: 事件顯然有高度相關(就是侯柯跟柯侯的
a2379928: 支持者),這樣誤差只會更小
Amulet1: 事實上你把相關性放進來3%還多讓了lol35F 118.160.161.28 台灣 11/19 01:34
Fallenshit: 本來就是要多讓 讓成這樣還要賴皮OMG36F 125.229.126.47 台灣 11/19 01:35
sangoking: 一份民調藍白各自解讀  484跟92共屎87%37F 203.203.60.131 台灣 11/19 01:35
sangoking: 像  嘻嘻
chx64: 你要是做一對一民調那叫做分手民調沒有要合39F 175.182.207.25 台灣 11/19 01:36
Hahafan: 喔喔  我知道了  感謝40F 1.164.14.21 台灣 11/19 01:36
a2379928: Hal大,不是什麼都要乘2好嗎?今天就是41F 112.78.84.4 台灣 11/19 01:37
a2379928: 把A-B當成一個東西了,意思就是A-B超過4
a2379928: .24%就是超過誤差範圍。
Blue24581: 推推44F 114.137.91.61 台灣 11/19 01:39
yoyun10121: 你今天要比差距的差距, 四個變數都有45F 114.43.166.110 台灣 11/19 01:39
yoyun10121: 誤差, 合成後簡單算的確誤差要乘兩倍
yoyun10121: 認真點算因為(1)和(2), 是機率有相關
yoyun10121: 一個是p, 一個是1-p, 所以光(1)-(2)誤
yoyun10121: 差合成後就兩倍, (3)-(4)一樣也是兩倍
Hahafan: 不過原PO應該也有想到,柯賴差距之間也要50F 1.164.14.21 台灣 11/19 01:41
yoyun10121: 差距的差距(1)-(2)-(3)+(4)=乘2.8倍..51F 114.43.166.110 台灣 11/19 01:42
Hahafan: 算誤差,侯賴也是,不是直接相減吧52F 1.164.14.21 台灣 11/19 01:42
yoyun10121: 所以你真要看差距的差距, 誤差是8.4%53F 114.43.166.110 台灣 11/19 01:42
yoyun10121: 結果是5:1侯贏
Fallenshit: 媽的笑死 怎麼還有人不懂互比跟對比55F 125.229.126.47 台灣 11/19 01:44
Fallenshit: 民調的定義在這邊大談阿
Hahafan: 對比的誤差乘以2,互比乘以sqrt(2)57F 1.164.14.21 台灣 11/19 01:45
formice: 其實我是相信專業的,不要一直把別人當58F 1.200.119.47 台灣 11/19 01:47
formice: 壞人,好歹也是會計學系教授。 到底一次
formice: 臭了幾個...
henrywinwin: 師傅說不要把別人想的那麼壞欸61F 218.173.135.99 台灣 11/19 01:47
yoyun10121: 7那個天才算法就是先算對比再算互比,62F 114.43.166.110 台灣 11/19 01:48
Hahafan: 柯賴誤差6%,侯賴誤差6%,柯侯誤差4.24%63F 1.164.14.21 台灣 11/19 01:48
yoyun10121: 誤差疊起來就2qrt(2)突破天際64F 114.43.166.110 台灣 11/19 01:48
qpeter: 現在已經不是讓幾趴的問題了 現在是65F 36.225.103.200 台灣 11/19 01:49
qpeter: TMD主張看數據(7)  KMT主張看數據(8)
qpeter: 兩邊連採取的"數據根據"都談不攏了...
jackypan1989: H的數學真的要回去重修…68F 114.36.183.11 台灣 11/19 01:49
yoyun10121: 有算誤差的話, 不管用(7)還(8)都侯贏69F 114.43.166.110 台灣 11/19 01:50
hsuchengchun: 沒錯 朱的誤差算法是錯的70F 114.137.104.107 台灣 11/19 01:53
Hahafan: 原PO應該要解釋柯賴之間為什麼就不算誤差71F 1.164.14.21 台灣 11/19 01:53
jackypan1989: 相關性高的只會讓誤差更小72F 114.36.183.11 台灣 11/19 01:54
jackypan1989: 那種直接加的,拜託去唸個大學好嗎
yoyun10121: 原PO就沒搞懂, (7)根本不是A-B, 怎麼74F 114.43.166.110 台灣 11/19 01:54
yoyun10121: 會只拿A-B的合成誤差來比
hsuchengchun: 差距的差距不是用隨機誤差76F 114.137.104.107 台灣 11/19 01:55
Hahafan: y大是對的,既然要算誤差,全都要算進去77F 1.164.14.21 台灣 11/19 01:55
EDFR: 怎麼計算其實都沒差啦, 重點是不看誤差侯幾78F 219.71.113.43 台灣 11/19 01:55
EDFR: 乎都輸怎麼服眾
Hahafan: 假設柯30,賴35,兩者差距最大是38-27=1180F 1.164.14.21 台灣 11/19 01:58
Hahafan: (7)的算法沒有考慮一份民調內的誤差
ecejc: 誤差全都考慮進來一樣最後根本 3% 都不必82F 122.116.74.16 台灣 11/19 02:12
ecejc: 讓
ecejc: 我先直接給公式
ecejc: 假設柯侯和侯柯的相關性是 Alpha (+1 到 -
ecejc: 1 之間)
ecejc: 柯侯(或侯柯)和賴蕭的相關性是 Beta (+1
ecejc:  到 -1 之間)
ecejc: 誤差值的平方是 sigma
ecejc: 那麼對比之後的誤差會是 (4 * [ 2 - (Alp
ecejc: ha - Beta)] * sigma)開根號
ecejc: 如果 Alpha 是 0.9 (會投柯侯的幾乎都投侯
ecejc: 柯),Beta 是 -0.9 (投賴的幾乎不投柯或侯
ecejc: )
ecejc: 那麼誤差變成 (4*0.2*sigma) 開根號
ecejc: 誤差值會剩下 = 0.89 倍
ecejc: 如果 Alpha 和 Beta 各是 0.8 和 -0.8
ecejc: 誤差值則會變 = 1.26 倍
Fallenshit: 笑死 照你說法 柯對比賴 賴取最大誤差99F 125.229.126.47 台灣 11/19 02:12
Fallenshit: 猴對比賴 賴取最小誤差 贏麻了 哈哈
Fallenshit: 沒有你H這種算法啦 拜託
ecejc: 如果朱侯還死咬統計誤差 那就讓民調公司102F 122.116.74.16 台灣 11/19 02:15
ecejc: 給出上述的相關性參數
ecejc: 我保證最後一定是朱侯自打臉
ecejc: 甚致直接柯4侯2
ppdadader: 因該立法11/18為台灣統計日 以後要放106F 114.137.59.176 台灣 11/19 02:18
ppdadader: 假
Hahafan: 同理,也沒有p1-p2求sigma的算法,必須回108F 1.164.14.21 台灣 11/19 02:18
Hahafan: 因為又要重新考慮相關性求變異數
ecejc: 樓上是不是看不懂我們在算什麼  你講的這些110F 122.116.74.16 台灣 11/19 02:21
Fallenshit: 到底在講什麼...111F 125.229.126.47 台灣 11/19 02:21
ecejc: 有raw data都算得出啦  還扯什麼沒算法112F 122.116.74.16 台灣 11/19 02:21
Hahafan: 所以就不能用(7)的算法,憑甚麼對比式113F 1.164.14.21 台灣 11/19 02:23
Hahafan: 不用考慮誤差,互比就要考慮誤差
ecejc: 樓上果然看不懂  我的算法就把所有誤差全算115F 122.116.74.16 台灣 11/19 02:24
Fallenshit: 哪裡講了對比不考慮誤差?原PO文章你116F 125.229.126.47 台灣 11/19 02:24
Fallenshit: 有看?
Hahafan: 網路上最新的Mcnemar似乎可以解決問題118F 1.164.14.21 台灣 11/19 02:24
ecejc: 還在扯沒考慮誤差119F 122.116.74.16 台灣 11/19 02:24
Hahafan: 但是不能確定一通電話一定問兩個問題120F 1.164.14.21 台灣 11/19 02:25
Fallenshit: 來抬槓的喔...你連民調公司都不信了121F 125.229.126.47 台灣 11/19 02:26
Hahafan: (7)的算法中有賴柯差距這一項,應考慮誤122F 1.164.14.21 台灣 11/19 02:26
Fallenshit: 那還看他數字幹嘛?題型這種東西也要123F 125.229.126.47 台灣 11/19 02:26
Fallenshit: 質疑?
Hahafan: 受訪者答一個問題,拒答另一個問題125F 1.164.14.21 台灣 11/19 02:27
Hahafan: 民眾黨算法是各自民調與賴相減再比較
elfish123: 這邊一堆文組最好看得懂,搞不好很多私127F 111.82.180.71 台灣 11/19 02:30
elfish123: 立學店的
Hahafan: 相減這部分不考慮誤差,互比就考慮誤差129F 1.164.14.21 台灣 11/19 02:30
Fallenshit: 你真的看不懂ㄟ 相減有考慮誤差阿130F 125.229.126.47 台灣 11/19 02:31
Fallenshit: 這邊誰跟你說不考慮誤差了?
Hahafan: 你誤差全部都考慮進去過大沒錯,但不能132F 1.164.14.21 台灣 11/19 02:31
Fallenshit: 只是誤差怎麼算大家有不同看法阿133F 125.229.126.47 台灣 11/19 02:31
Hahafan: 我在回答e大問題134F 1.164.14.21 台灣 11/19 02:31
Hahafan: 既然大家都有不同看法,我認為要考慮誤差
Fallenshit: 他不是跟你寫算式了?那就是她認為的136F 125.229.126.47 台灣 11/19 02:32
Fallenshit: 誤差阿
Hahafan: 互比只有考慮sqrt(3%+3%)一個誤差138F 1.164.14.21 台灣 11/19 02:33
Fallenshit: 你說別人沒考慮誤差是怎樣?139F 125.229.126.47 台灣 11/19 02:33
Hahafan: 柯賴相減的誤差就沒有考慮到140F 1.164.14.21 台灣 11/19 02:33
ecejc: 我的公式有考慮相減的誤差啦  只是你沒看懂141F 122.116.74.16 台灣 11/19 02:33
Hahafan: e大考慮所有誤差,誤差過大,所以他說不142F 1.164.14.21 台灣 11/19 02:34
Hahafan: 不能因為誤差大就不考慮,有別的算法
Fallenshit: 什麼叫做有別的算法?共變數你懂嗎?144F 125.229.126.47 台灣 11/19 02:35
Fallenshit: 不懂的人真的要在這裡大談?
Hahafan: e大算的誤差還是用互比的算法,並非對比146F 1.164.14.21 台灣 11/19 02:41
Hahafan: 我之前沒看清楚,我以為有考慮進去
Hahafan: 他把柯賴、侯柯、侯賴當作同等地位
Fallenshit: 你先告訴我sqrt(3%+3%)是多少好不好..149F 125.229.126.47 台灣 11/19 02:42
Fallenshit: 你自己打的喔 我可沒賴你
Hahafan: 所以直接用相關係數下去算,相減不一定可151F 1.164.14.21 台灣 11/19 02:43
Hahafan: 根號(3%+3%)是還沒有考慮到相減
Fallenshit: 我問你數字 你在那扯東扯西153F 125.229.126.47 台灣 11/19 02:44
Hahafan: 考慮相減,最極端的值是sqrt(6%+6%)154F 1.164.14.21 台灣 11/19 02:45
Fallenshit: 所以數字是多少啊?155F 125.229.126.47 台灣 11/19 02:45
Fallenshit: 聽聽看有沒有道理啊
Fallenshit: 阿 真無趣 烙跑惹ㄇ
Fallenshit: 正黑數學天才...
Hahafan: 我已經寫了啊,(7)的誤差沒有公式可用159F 1.164.14.21 台灣 11/19 02:51
Fallenshit: 我問你sqrt(3%+3%)數字是多少啦!160F 125.229.126.47 台灣 11/19 02:52
Hahafan: McNemar's test 的公式要確保有配對樣本161F 1.164.14.21 台灣 11/19 02:52
Fallenshit: 我問你sqrt(3%+3%)數字是多少啦!162F 125.229.126.47 台灣 11/19 02:52
Fallenshit: 拜託 回答一下很難嗎..
howhowhaha: Fall大妳幹嘛跟他認真啊164F 36.230.120.166 台灣 11/19 02:54
Hahafan: sqrt(6%^2+6%^2)=6.36%165F 1.164.14.21 台灣 11/19 02:55
howhowhaha: 這個人看起來就是上網找一堆自己也看166F 36.230.120.166 台灣 11/19 02:55
howhowhaha: 不懂的名詞貼上來
howhowhaha: 搞得好像自己很專業,笑死狂跳針
howhowhaha: 真的是為了讓侯侯贏什麼下限都可以不
howhowhaha: 管欸
Fallenshit: 終於發現公式亂套惹 嘻171F 125.229.126.47 台灣 11/19 02:56
howhowhaha: 深綠侯粉172F 36.230.120.166 台灣 11/19 02:56
Fallenshit: 我要笑死了 哈哈哈173F 125.229.126.47 台灣 11/19 02:56
Fallenshit: 才剛學會的公式不要硬亂用啦 吼
Gardenia0603: 感謝解說175F 118.167.19.116 台灣 11/19 04:32
ryan9527: 跌破大家眼鏡及摜破藍營人士的底氣不是176F 122.100.71.121 台灣 11/19 05:54
ryan9527: 在吵誤差範圍,而是原本以為各拿一份內
ryan9527: 參民調,在取讓分前會是1:1開局,卻沒
ryan9527: 想到連藍營拿出來的侯柯還輸,支持者們
ryan9527: 若不懂還算正常,可是藍營的黨公職跟民
ryan9527: 代要怎麼在未來2個月內護航下去

--
※ 看板: HatePolitics 文章推薦值: 0 目前人氣: 0 累積人氣: 294 
分享網址: 複製 已複製
1樓 時間: 2023-11-19 13:02:40 (台灣)
  11-19 13:02 TW
我嫂嫂會計的,
看了統計學朱博士說的6%笑而不語....
2樓 時間: 2023-11-19 13:10:39 (澳大利亞)
  11-19 13:10 AU
笑死,國民黨從頭到尾根本沒說過6%
而是白紙黑字寫著誤差範圍內國民黨當正的
r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇