看板 HatePolitics作者 brian900530 (LmWAng9)標題 [黑特] 統計誤差 根本兩黨都在亂講時間 Sun Nov 19 02:36:48 2023
首先 抽樣誤差是在統計學上本來就會有的限制
只是用機率的形式來展現
拿抽樣誤差3%6%來說要讓幾% 根本就在亂用
到底指的是民調數字讓3%?讓抽樣誤差?
還是只要沒有統計上的顯著差異就讓?
講的不清不楚
更別說兩黨在比的東西不一樣吵的東西也不一樣
一邊比差距的差距,一邊比柯侯-侯柯
一個是相對數字一個是絕對數字
兩邊所謂的3%6%指的根本就不是同一件事
到底在吵什麼,也完全是看不懂
假設有效樣本數1068 在95%信心水準下
誤差就是+-3%,舉例來說就是100的正負3
但這只能用在計算單一統計值的時候
今天是把一個民調裡面的兩個統計值拿來相比
下面就直接節錄一些臉書上教授寫的文
支持率的差異不一定要超過兩倍的抽樣誤差(柯文哲說的6%)才會達到統計顯著
第一因為3%是保守最大值的估計,實際上的「抽樣誤差」通常會比3%小。
再者信賴區間有重疊也不代表沒有達到統計顯著
第二,兩個人的對比支持率是同一個民調做出來的,不是獨立樣本,不能忽略相關性。
———————————————————————
以下是同一民調不同問題得出的支持度應該怎麼比較:
https://i.imgur.com/4sM2ya6.jpg
以匯流為例,樣本數n = 2046,(1) 柯侯48.3%對比(2)賴蕭 39.2%,所以(1)-(2) = (3)
兩個統計量的差異的標準誤差是這樣算的
https://i.imgur.com/50DV1iY.jpg
sqrt( { p1*(1-p1) + p2*(1-p2) + 2*p1*p2} /n )
=
sqrt( (0.483*(1-0.483) + (0.392)*(1-0.392) + 2* 0.483*0.392)/2046)
= 0.021
因為柯侯: 賴蕭 是在同一個問題問的,支持柯侯就不會支持賴蕭 (互斥)
所以這兩個支持率的相關性是負數,這就是為什麼公式後面為什麼會多出2*p1*p2。
所以柯侯對比賴蕭的支持率要超過1.96*2.1% = 4.1%,才有統計上的差異。
同樣的方式可以算出(4)-(5)=(6),兩個統計量的差距的標準誤差是0.0207。
所以侯柯對比賴蕭的支持率也是超過1.96*2.07% = 4.1%,才有統計上的差異。
但是如果要直接比較柯侯對侯柯的支持度,就得考量到這是兩個不同問題得到的
而且支持柯侯的人也會比較傾向侯柯,所以相關性為正。
而(1)-(4)的標準誤差會長得像這樣
sqrt( ( p1*(1-p1) + p2*(1-p2) - 2*v ) /n )
=
sqrt( (0.483*(1-0.483) + (0.461)*(1-0.461) - 2* v)/2046)
= ???
v 是柯侯跟侯柯在兩個問題的共變異數,得用原始資料去估計。
沒有v就算不下去
也就是說,不論是(3)-(6)=(7)還是(1)-(4)=(8)只要沒有原始數據
都算不出來應該怎麼決定有統計意義的差距。差距的誤差不是抽樣誤差
結論:
再怎麼說 藍白合民調比拼絕對不是拿兩個數字來相減然後說
喔你看在6%內然後另一邊說才不是明明是3%
這是需要民調專家學者很細緻的去運算的
都已經找來兩個專業的來當裁判
原始數據都在這些人手上
明明是一翻兩瞪眼的東西結果演成這樣
所以我也看不懂朱立倫記者會到底在說什麼
至於柯說什麼3% 那根本是在侮辱統計學
畢竟這咖連p-value<0.05都可以說是不具重要性,還期待他講對什麼?
--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.161.227.108 (臺灣)
※ 作者: brian900530 2023-11-19 02:36:48
※ 文章代碼(AID): #1bMGH2Hf (HatePolitics)
※ 文章網址: https://www.ptt.cc/bbs/HatePolitics/M.1700332610.A.469.html
推 Drkate: 只是想操弄選民的話術而已1F 203.204.87.233 台灣 11/19 02:38
推 Supasizeit: 所以三個專家是去亂的2F 203.204.194.135 台灣 11/19 02:38
→ boboking2: 又是哪一個專家 那麼多專家要聽誰的3F 36.238.200.86 台灣 11/19 02:38
推 lofi23: 認真給推 多點人像這樣就好了4F 101.10.104.131 台灣 11/19 02:39
→ hTCU11: 朱立倫把統計亂講一通5F 118.169.19.7 台灣 11/19 02:40
推 lono: 證明台灣的統計教育失敗6F 123.193.55.164 台灣 11/19 02:40
噓 totqoq: 你行就不會一年領不到1000k,人家那三個出席這次不知道賺多少7F 42.76.152.49 台灣 11/19 02:40
※ 編輯: brian900530 (1.161.227.108 臺灣), 11/19/2023 02:41:02
→ lono: 以後要考過統計才能獲得公民權10F 123.193.55.164 台灣 11/19 02:41
→ skywalker21: 我今天看了一整天版跟網路
就你說的最正確
起碼整個思路都是對的
幹,一堆會計教授統計教授都亂嘴11F 42.72.86.9 台灣 11/19 02:41
推 NightxFrog: 對…柯師傅還有p-value < 0.0515F 111.82.148.41 台灣 11/19 02:42
→ skywalker21: 那些政客真的能回學校教書嗎?16F 42.72.86.9 台灣 11/19 02:42
推 mazinkisa: 就事論事,你才在侮辱統計學,正常誰看統計學計算結果事,會看計算過程怎麼算!
除非有人要驗證數據計算結果,不然正常人看統計包括都會先看結果,再求驗證!
你這說法是在侮辱每一份統計報告的數據公正性與專業度,到底是誰在侮辱統計學17F 125.231.64.233 台灣 11/19 02:42
推 hTCU11: 你確定那兩位"裁判"是專業的?27F 118.169.19.7 台灣 11/19 02:43
→ skywalker21: 一堆所謂的專家碰到政治都不專業了28F 42.72.86.9 台灣 11/19 02:43
噓 PRME: 笑死我了 文組29F 36.226.76.118 台灣 11/19 02:43
推 l983: 你敢質疑我民眾黨認證的民調專家關智宇?30F 118.170.32.236 台灣 11/19 02:43
推 mouscat: 其實光6點決議跑出那個3就可以看出沒人真的在乎統計方法啦 柯根本不懂p-value31F 103.44.33.145 澳大利亞 11/19 02:43
→ skywalker21: 大家就此議題在學理上講公正的判斷33F 42.72.86.9 台灣 11/19 02:44
→ mouscat: 顯著這些 藍大概是知道自己劣勢又不想副才搞出這條34F 103.44.33.145 澳大利亞 11/19 02:44
→ skywalker21: 我覺得很難,不是數學難是政治難36F 42.72.86.9 台灣 11/19 02:44
→ PRME: 抽樣誤差是絕對誤差,除非特別說明才用相對37F 36.226.76.118 台灣 11/19 02:44
→ CHENXOX: 兩邊都4用想給對方下套の想法在談判 泥怎麼會覺の有人會想要1個公正の方式去訂規則 這樣就沒今天這齣戲碼了啊 94故意留下空間才能各自表述 e開始94為了分手才去談整合の這句話懂得就懂38F 114.136.232.249 台灣 11/19 02:44
→ l983: 柯文哲自己親口說柯侯配沒顯著贏侯柯配,43F 118.170.32.236 台灣 11/19 02:45
推 berryc: 不重要啦...剩5天要再比一次民調嗎?44F 122.116.89.28 台灣 11/19 02:45
→ l983: 他願意整合當副的,才沒兩天,笑死45F 118.170.32.236 台灣 11/19 02:45
→ berryc: 如果要再比就只有不讓分直球對決46F 122.116.89.28 台灣 11/19 02:45
→ brian900530: 我現在就是在跟你說 藍白協議讓統計誤差 根本就不是在讓什麼3%6% 那要透過運算才能知道是多少47F 1.161.227.108 台灣 11/19 02:45
→ berryc: 想也知道KMT不可能答應, 內褲都被看光了XD50F 122.116.89.28 台灣 11/19 02:45
推 zaq1xsw21212: 2-3天民調就做完了 5天為什麼不能做?51F 1.200.2.139 台灣 11/19 02:46
推 cutbear123: 找了兩個教授算出來 結果大家都不信==53F 1.162.61.29 台灣 11/19 02:46
→ brian900530: 是柯文哲天真的以為統計誤差是固定54F 1.161.227.108 台灣 11/19 02:46
→ l983: 藍白綠各自選啦,票開出來就知道誰沒穿褲子55F 118.170.32.236 台灣 11/19 02:46
→ brian900530: 3% 然後藍的也不知道在算什麼56F 1.161.227.108 台灣 11/19 02:46
推 skywalker21: 希望這題不會變成未來學生統計學考題57F 42.72.86.9 台灣 11/19 02:46
噓 PRME: 一堆統計0分的 學別人講誤差58F 36.226.76.118 台灣 11/19 02:46
→ cutbear123: 不如開放統計教授報名 來多數決好了59F 1.162.61.29 台灣 11/19 02:46
→ PRME: 肚子好痛60F 36.226.76.118 台灣 11/19 02:46
→ skywalker21: 不然就是禍害未來學子了61F 42.72.86.9 台灣 11/19 02:47
→ cutbear123: 明明是純粹的數學問題 居然搞成這樣62F 1.162.61.29 台灣 11/19 02:47
推 mouscat: 藍的就是把每份民調的「抽樣誤差」那個數字*2當成讓的分數63F 103.44.33.145 澳大利亞 11/19 02:47
推 sheng319: 雖然不知道對不對 但認真給推65F 220.143.7.182 台灣 11/19 02:48
噓 PRME: 要不要借本 抽樣方法 看看你講的多好笑66F 36.226.76.118 台灣 11/19 02:48
推 ZeroValue: 推你認真,可惜這是政治問題67F 101.137.189.217 台灣 11/19 02:50
推 ben811018: 柯說的讓3趴 就是柯如果贏侯低於3趴,就算侯嬴。很簡單的敘述69F 220.142.93.236 台灣 11/19 02:55
推 PRME: 吳母樹沒有比有母樹 準確71F 36.226.76.118 台灣 11/19 02:57
※ 編輯: brian900530 (1.161.227.108 臺灣), 11/19/2023 02:57:51
推 nnkj: 支持藍白趕快分一分72F 36.231.127.148 台灣 11/19 03:03
推 doshajou: 講的就是蔡正元的計算方式,可以去看
直播,結論就是其實是柯贏73F 36.233.219.56 台灣 11/19 03:08
推 holan40: 因為記者會是面向大眾的,不可能講這麼複雜,反而是政論節目一堆在胡扯76F 111.253.243.30 台灣 11/19 03:13
推 k0111: 我是不相信有學過統計年過碩士會挺柯說法79F 106.1.224.12 台灣 11/19 03:19
推 kyamato: 推80F 122.100.80.248 台灣 11/19 05:51
→ ryan9527: 越複雜的學術討論,很多專家會議都很難討論出共識,11/18這天證明了81F 122.100.71.121 台灣 11/19 06:07
--