顯示廣告
隱藏 ✕
※ 本文轉寄自 ptt.cc 更新時間: 2023-09-18 16:41:04
看板 HatePolitics
作者 Tpintrts (Tt.梅梗)
標題 [討論] YT民調結果資料查詢工具
時間 Mon Sep 18 13:35:26 2023


https://www.aweb.tpin.idv.tw/president2024/
簡單的說是整理一些YT頻道的民調結果的工具。

你可以透過篩選「日期區間」、「訪問縣市」、「頻道」的方式,來查詢相關結果。
頻道可以選擇複數的頻道,下面的圖表會加總他們的結果,
例如你認為A頻道和B頻道特別可信,
那你就可以勾選這兩個頻道來混合他們的樣本。
https://i.imgur.com/ICIkBn2.png
[圖]

其中包括了篩選條件下的結果圓餅圖,如果頻道有做年齡收集,那也會有年齡分佈的長條
圖,然後會有每支影片的民調結果列表和連結。
https://i.imgur.com/fqkxBD7.png
[圖]

在列表中點選「細節」則會有該影片調查結果的圓餅圖與年齡分佈(如果有)的細節資料
https://i.imgur.com/2TjqDhY.png
[圖]

然後會有篩選條件中的年齡取樣分佈及地區取樣分佈
https://i.imgur.com/kWPkaog.png
https://i.imgur.com/a8DWCmj.png
[圖]
 
[圖]

點選「全部頻道圓餅圖比較」則可以觀看全部頻道的圓餅圖
https://i.imgur.com/4QwquQc.png
[圖]

點選「查看樣本細節」則會回到單一頻道的上述資料內容。


以下一點感想:
一邊輸入資料,一邊感受到抽樣的重要。

實際上,有時我們會覺得民調的結果和自己「體感」不同,其實有時候也不是民調「做假
」,可能只是他的抽樣方式的關係。

像「街頭麥克風」他可以做出柯文哲60%以上這樣的支持度,然而你會發現在的年齡分佈
中,他訪問了壓倒性大量的年輕人,而且地點也只有花蓮的東大門夜市,在這種情況下,
我們頂多只能講「柯文哲在會去東大門夜市的年輕人裡,有60%以上的支持度」而不能說
「柯文哲支持度超過六成」,甚或,你還可以歪樓說「柯文哲的支持者可能都喜歡逛夜市
」。


對照其他的頻道訪問夜市的影片,也可以發現柯文哲總是會得到壓倒性的票數,可以說柯
文哲是夜市的霸主。

但「桃園孫先生」,就很容易做出藍營第一的結果,即使如此,當他訪問地點是在晚上
的西門町一類的地方時,一樣也會做出柯文哲壓倒性的票數,
他會經常做出藍營第一的結果,
恐怕是因為他調查的區域經常是在台北桃園的早上,這些時間老人較多,又是北部,按照
過去選舉的結果,藍營支持者本來就比較多。

不過值得注意的是,除了「街頭麥克風」以外的頻道,當累積樣本數達一千以上時,無論
柯侯的比例如何,綠營的比例總是在30%以上。

就目前來看,其實YT街訪能做出明確的結論的東西和傳統民調沒兩樣「柯文哲年輕者支持
度極高」、「綠營鐵票有30%左右」

樣本數太少時,按照抽樣方式,某方面來說可以控制結果,
如果你想做出侯第一的結果,就去雙北的早上市場訪問。
想做出柯第一的結果,就去全台各大夜市。
想做出賴第一的結果,就去雲林以南的早上市場訪問。

YT民調最大的問題就是單一影片取得的樣本數太少,街訪型式又使地域受限,集合多支影
片的樣本數又可能時間太長,如果不假設「投票意向不會有變動」的話,過長的時間也會
成為失真的因素。


但反過來說,市話和手機也同樣有這種型式下的限制存在,而且YT影片的好處是你可以知
道他的訪問和抽樣方式,進一步知道他的調查缺陷,再來決定它的參考程度可以到哪裡,
或要做什麼樣的加權去調整它,但傳統民調基本上你一無所知,從他的問卷設計,到打電
話的廣度、幾點打電話都不知道,例如用前面得到的結論,如果你總是在早上打市話訪問
,那麼接到電話的是老人的機會就比較高,自然訪到支持柯文哲的機率就低。所以民調也
未必需要「做假」,它只要設計一個符合期待結果的抽樣規則就好。


所以到頭來盡量讓樣本數多一點,分佈廣一點,大概是讓調查更接近真實的唯一解,只是
這樣就要花很多錢,所以今天有一些youtuber願意自發的做田野調查,這些資料其實還是
滿珍貴的。


然後不得不說「木炭民調」和「阿凱街頭民調」是有比其他頻道更認真,他們訪問了年齡
也試圖平衡訪問年齡區段的樣本,也盡可能的訪問不同的縣市讓區域擴大。而「桃園孫先
生」的毅力也令人佩服,他一個人至今就貢獻了雙北和桃園地區共超過4000份的樣本,即
使他抽樣的廣度不足,但其實可以把它視為該區域該時段的調查人員,之後與其他YT在不
同時間不同地點訪問的結果做統合,或許也能得到接近真實的結果。



--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.115.132.20 (臺灣)
※ 作者: Tpintrts 2023-09-18 13:35:26
※ 文章代碼(AID): #1b1-6ZcQ (HatePolitics)
※ 文章網址: https://www.ptt.cc/bbs/HatePolitics/M.1695015331.A.99A.html
Robben: 接訪的問題就是 沒有帶入模型1F 101.12.91.90 台灣 09/18 13:37
skylion: 孫先生其實賴第一的次數似乎比侯多2F 101.9.50.37 台灣 09/18 13:37
hydra6716: 這大家都懂阿,就白癡想黑繼續黑3F 220.132.132.65 台灣 09/18 13:37
herboy: 傳統民調打電話時間那些也會調整,這些人4F 42.72.228.110 台灣 09/18 13:38
herboy: 最重要的功能是賺抖內
KONAMI: 電話通常晚上吧6F 36.239.191.249 台灣 09/18 13:38
chu: https://i.imgur.com/KhUzRVw.png7F 111.71.212.117 台灣 09/18 13:39
chu: 柯屁連20歲都輸賴神17% 你說夜市柯屁屠殺?
[圖]
其實我也就只是針對YT的做出結果有這個現象,當作例子說頂多可以這樣做結論。
不過我知道這種錯置延伸別人講的內容的方式,是一種找架吵的方式。
所以,嗯,我覺得你說的對。
iamdota: 街訪輾壓電話老三只能說明一件事9F 104.28.156.246 台灣 09/18 13:40
iamdota: 柯粉平常沒人對話,特別愛跑出來表態抬槓
hydra6716: 笑死 以前的說法好像是現實沒人敢承認11F 220.132.132.65 台灣 09/18 13:41
chu: 美麗島有無敵參數可以調整年輕人 你敢質疑?12F 111.71.212.117 台灣 09/18 13:41
victoryman: 推13F 124.218.141.73 台灣 09/18 13:41
hydra6716: 照這邏輯 那就是塔綠斑現實都不敢承認14F 220.132.132.65 台灣 09/18 13:41
hydra6716: 只敢躲在電話裡 嘻嘻
hydra6716: 看現實敢說挺賴皮的幾乎都無腦老人
chu: 早上+市話 搭配無敵參數 一樣知道柯屁20崩了17F 111.71.212.117 台灣 09/18 13:42
s81048112: 照某人邏輯 716柯粉不就更慘更無腦18F 39.12.49.166 台灣 09/18 13:47
s81048112: 只能躲在八卦
excia: 不要再市話=老人了 認真的民調公司會把超20F 49.216.174.205 台灣 09/18 13:48
excia: 過樣本比例的年齡層按比例縮小 少於比例的
excia: 放大 如果太少就一直打到一定數量為止 不
excia: 要再自我安慰市話都是老人不準
其實也不是說民調公司就不準,大家會質疑,主要就是你也看不到他們原始樣本,
也不知道他們的加權方式、抽樣方式,結果開始有人想知道怎麼回事,
這事就成為一種題材,所以才會搞到一些YT跑出來做調查。
民調公司如果重視自己的信用,當然也是會想盡力認真做準,
無不可否認的,民調還是具有影響選舉結果的功效,
即然如此,自然也會有人想把它當操作工具了。
即使這些YT在有限的人力物力下,做得調查無比粗糙,
但大膽假設,設法求證,還是個不錯的精神吧,
而且收集到的樣本也不能說全無意義啊。
至於很多人喜歡酸他們為了流量,一般民調如此花錢,
他們以流量當報酬去做這些事,其實也還好吧,
大家想知道他們就做,而且觀眾還不用付錢。
add20716: 現實不敢承認 2020有817萬票 笑死24F 223.137.206.73 台灣 09/18 13:50
add20716: 柯粉只敢躲在網路叫囂
※ 編輯: Tpintrts (59.115.132.20 臺灣), 09/18/2023 14:01:08
excia: 街訪取樣方式 比例都不對 樣本數再大都無26F 49.216.174.205 台灣 09/18 13:53
excia: 法推估母群體
你這說法可能就有語病了,如果樣本數大到接近或等於母群體數,那就有用了吧,
不過我不是要和你吵架,確實,投票人數有1950萬,YT再努力也不可能做那麼多,
就算做了十萬份,如果全部都是集中在某個時間區域的人口,那也沒有用。
不過他們收集的東西還是可以透露一些現象才是,也不能說全無價值吧。
GYGY5566: 2020有817不代表什麼28F 111.71.212.127 台灣 09/18 14:01
GYGY5566: 2022沒看到市長選舉死成那副德性
neverfly: garbage in garbage out30F 42.73.73.197 台灣 09/18 14:01
※ 編輯: Tpintrts (59.115.132.20 臺灣), 09/18/2023 14:05:30
chu: 我也不是很想相信美麗島31F 111.71.212.117 台灣 09/18 14:08
chu: 只能盡量相信 然後投票去打臉美麗島
chu: 就像三立自由 不管做什麼什麼民調 根本沒人信
aling1205: 純市話就是90%老人民調啊,選民又不是34F 122.121.164.128 台灣 09/18 14:10
aling1205: 只有市話的會去投票,TVBS都改50/50了
aling1205: ,別再安慰自己市話才準了
chu: YT唯一好處就是可以統計民眾的理由37F 111.71.212.117 台灣 09/18 14:11
chu: 一般民調只有數據
excia: 某人根本就不看別人講什麼 就說會按比例調39F 49.216.174.205 台灣 09/18 14:14
excia: 整 假如20-29本來需要100人只有50人 就會
excia: 把50人的結果放大成100人 反之亦然 不要把
excia: 民調公司當白癡
sariel0322: 做了很多敘述性統計,除了比起這些yte43F 114.136.90.132 台灣 09/18 14:15
sariel0322: r更有整理的意義以外,基本上是garbag
sariel0322: e in garbage out
excia: 有時候一些民調波動過大 就是樣本數沒有做46F 49.216.174.205 台灣 09/18 14:18
excia: 足 例如可能20-29只有10人要100人就放大10
excia: 倍 但10個樣本很容易發生極端的結果 放大
excia: 就失真
Slzreo1726: 街頭訪問的民調只能做敘述統計而不能50F 111.71.214.86 台灣 09/18 14:19
Slzreo1726: 做推論統計 也就是你做出來只是給自
Slzreo1726: 己看得爽 根本不能推估母體 還以為樣
Slzreo1726: 本放大就能解決?館長民調樣本幾萬票
Slzreo1726: 內
你不需要為了別人不懂統計學而那麼生氣,
街訪民調在統計學上被罵爆我也知道,
缺乏設計下,不能用於推估母體,我也知道,
可是你要罵人家,總要提出一點理由吧?
這個東西某方面就是說明了YT街訪光是從「抽樣」開始就大有缺陷,
所以大家要小心看待。

至於做再多也不能推估母體(除非樣本數極端到接近母體),我也很同意,
館長民調幾萬份,比起1950萬的投票人口來說仍是遠遠不足的。
但我也必須說,如果我只是想做小規模的統計研究,
例如:「會去東大門夜市的人的支持傾向」,
那「街頭麥克風」的繼續做到二十萬份的數據會不會就有點意義了?
說不定他就是想知道東大門夜市的支持度麻。
※ 編輯: Tpintrts (59.115.132.20 臺灣), 09/18/2023 14:34:51
Antler5566: garbage in, garbage  out55F 42.79.137.212 台灣 09/18 14:23
excia: 敘述性統計不是毫無價值 但拿來推估母群體56F 49.216.174.205 台灣 09/18 14:23
excia: 就不對
excia: 比如說那些車友民調 讓大家知道跑山的族群
excia: 支持柯比例非常高 這個就無需懷疑
chu: https://i.imgur.com/D8AbLT0.png60F 111.71.212.117 台灣 09/18 14:27
[圖]
excia: 去集中訪問例如跑山車友 眷村老人 百貨貴61F 49.216.174.205 台灣 09/18 14:31
excia: 婦 八大小姐 宮廟+9 針對特定族群去主題性
excia: 研究 我會認同的這種做法 但拿來跟傳統民
excia: 調比就是搞笑
我明白你生氣的原因了,
我想我會讓你覺得拿來根傳統民調比,應該是我表達方式不好。
傳統民調,有民調公司的專業,只是因為大家不相信,
才會搞到有YT出來做,而他們做的目的,有一些確實是想要「打臉傳統民調」,
或質疑傳統民調,所以他們確實是想和傳統民調「比較」,
但這種比較會有有很多統計學上的問題。
我想表達的事其實和你差不多啊,
或許最後一段讓你覺得,我好像是在說如果收集了很多份就有用,
進一步說,我的意思是,如果每個縣市都有四個孫先生,
並且分別在不同的時段做調查,最後收集這些樣本,
「或許」就有點用。
然而現實確實是每個YT個自為政,所以最後出來的數據大概無法推估母體,
所以我們其實是有共識的吧?
Maniacs: 推這篇65F 109.42.177.221 德國 09/18 14:38
※ 編輯: Tpintrts (59.115.132.20 臺灣), 09/18/2023 14:46:18
VicOladipo: 柯韓粉真的表態率很高啊66F 114.137.155.209 台灣 09/18 14:38
shiriri: garbage in garbage out67F 101.10.65.244 台灣 09/18 15:04
zebra7: 民調公司有沒有做都不知道了 有種錄音公68F 114.136.124.127 台灣 09/18 15:06
zebra7: 開 不然都在唬爛而已
chivalry10: 抽樣和拒答率!你為何要浪費才能啊70F 42.79.191.186 台灣 09/18 15:18
jim052: 就算像你所說的,每個縣市都有四個孫先生71F 1.169.153.173 台灣 09/18 15:30
jim052: ,這樣的街坊民調也是沒用的
jim052:
jim052: 因為你所挑選訪問的對象本來就會有潛意識
jim052: 的偏好
jim052: 所以結果很自然會放大你的偏好
jim052: 更別說如果我是yt,我多做幾次大約知道怎
jim052: 樣的人會有怎樣的政治偏好後,我就針對那
jim052: 些人訪問就好。不一定是年齡,還有穿著等
jim052: 等其他各種可以挑選的差異
jim052: 甚至還有逆向挑選的問題
jim052: 這些都是無法解決的
HyperPoro: 也不用在這邊吵 等選舉結果出來就知道83F 223.140.156.148 台灣 09/18 15:36
HyperPoro: 誰比較準了
其實,我個人覺得民調最後終究是不會準的。
因為這世界是二階混沌系統,天機一但洩露就不再有用,
選舉最明顯的例子就是棄保,也許你今天調查我,我要投給A,而且不想讓C上,
但後來我「體感」覺得B比較有可能打敗C,所以我最後投了B
這時候,你能指責之前調查我要投給A的人是「不準確」的嗎?不公平吧?
所以其實吵民調,對於一些選民來說,是棄保或當天要不要去投票的判斷準則,
對於堅定支持者來說,則是判斷自己支持的候選人的「勝率」而已,
娛樂效果的意義可能還大一點。
它對候選人的意義則是當下努力的方向。
所以嚴格來講,頂多只能求「當下」它是「準確」反映現況的,
但它究是不是真的「準確」反映現況,只有神才知道,
對個人來講,只有信不信的問題而已。
jim052: 就算yt比較準,那還是沒用的,壞掉的時鐘85F 1.169.153.173 台灣 09/18 15:37
jim052: 一天也會準兩次
※ 編輯: Tpintrts (59.115.132.20 臺灣), 09/18/2023 15:45:59
jim052: 本質上其挑選的方法就是無法經過學理證明87F 1.169.153.173 台灣 09/18 15:37
jim052: 當然民調公司的民調有他本身的問題,但這
jim052: 不代表我們就可以用街坊取代

--
※ 看板: HatePolitics 文章推薦值: 0 目前人氣: 0 累積人氣: 85 
分享網址: 複製 已複製
r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇