顯示廣告
隱藏 ✕
※ 本文為 MindOcean 轉寄自 ptt.cc 更新時間: 2020-04-14 17:11:36
看板 Gossiping
作者 papple23g (逆道者)
標題 [問卦] Ptt推文曝光度分析的八卦?
時間 Tue Apr 14 16:34:31 2020




大家好

昨晚看到一篇「用JPTT的給我進來」的文

以及看到底下滿滿 imgur 的圖片

小弟的數據魂莫名燃燒了起來(?


大家知道 imgur 圖片網址把後面的點(.)和附檔名刪掉的話

就可以看到這張圖被多少人瀏覽過

像這張截圖顯示的那樣
https://i.imgur.com/yiza167.png
[圖]
 

記得以前imgur還提供過瀏覽量的趨勢圖,但現在已經拿掉,剩下瀏覽數了qwq

然後,不知道大家有沒有好奇過

一篇被推爆的文章裡面,大部分的鄉民究竟都會往下滑到幾樓?

或者更精確地說,如果把某個推文的樓層數字當作界線

那麼高曝光度與低曝光度的界線究竟在哪裡?


「用JPTT的給我進來」這篇文章

除了滿足了爆文的條件以外

推文圖片的密集度也非常之高

而且每張圖片都是當下產生的,所以瀏覽數都是從零開始計數

加上大家的圖片容量大小也都差不多(空白+塗鴉),載入時間理論上也相去不遠

如果把所有樓層的圖片瀏覽量抓下來,再和對應的樓層數作圖的話

不就能得到 推文樓數 vs 曝光度 的分布圖了嗎?


廢話不多說,直接把程式獲取的結果po上來
https://i.imgur.com/8ArFNXu.png
[圖]
 

這個是在文章po出5小時後得到的數據

可以看到除了有指數衰減之外,還有一些斷層,以及謎一般的雙層結構

雙層結構的真相其實很簡單,就是圖片連結開頭是https還是http

https的載入時間短,自然它的瀏覽量比較多

不過這不是我們想探討的主題

我們知道指數衰減是可以預期的,因為大家沒有那麼多時間一直往下滑

但是斷層又是怎麼回事呢?

我認為這是各個平台上面分段載入ptt頁面所導致的結果

每個平台上面的分頁斷點都不同

像JPTT我記得是1000推左右會換到下一頁

而這些斷層正是綜合了所有平台的瀏覽斷點而產生的結果


來看一下前200樓的瀏覽分布
https://i.imgur.com/ANdeix1.png
[圖]
 

可以看到瀏覽量有三個層級

36樓以前是三萬以上的瀏覽量

37~86樓,是二~三萬的瀏覽量

87樓以後都是一萬以下

接著是推文後半部的瀏覽量分布
https://i.imgur.com/4fYiX16.png
[圖]
 

197樓突然出現一個大斷點

瀏覽量瞬間跌到3000以下

最後的斷點就是JPTT的1000樓左右

之後就是每隔100樓出現一次衰減循環

我想這對應的就是其他平台上的翻頁斷點吧?


結論:

1. PTT推文瀏覽量的斷層界線為 37樓、87樓、197樓和1000樓
2. https開頭的圖片瀏覽數較高

走筆至此,想到如果有網軍要帶風向,佔據前87樓是非常容易的事情

呼籲大家除了翻到不同頁面聽聽其他的聲音以外

自己花時間消化資訊思考求證也是很重要滴~


以上就是小弟的分析結果




另外有些人可能會問

530樓那個突起點到底是三小
https://i.imgur.com/IHrYddW.png
[圖]
 

我趕緊撈出那筆資料來看

結果

https://i.imgur.com/eIdpcvL.png
[圖]
 



是凱留


我不知道  這已經超出我的理解範圍




--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.216.6.172 (臺灣)
※ 文章代碼(AID): #1UbNMPEh (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1586853273.A.3AB.html
Fly17: 這已經超出我的理解範圍1F 04/14 16:35
whiteseyes: 他媽的這三小XD2F 04/14 16:35
KangSuat 
KangSuat: 恩 跟我想的一樣3F 04/14 16:35
lostman: 530樓!!!4F 04/14 16:37
tchaikov1812: 凱留:接數據的頭5F 04/14 16:37
Dinenger: 凱留是誰6F 04/14 16:37
gay7788: 凱留發錢啦7F 04/14 16:38
emptie: 但如果是pc使用者看到這篇 一定直接點網頁版8F 04/14 16:38
emptie: 這樣基本上所有的圖都會被開過一次
tim32142000: 你好認真作統計10F 04/14 16:39
emptie:  另外就是其實有一部分行動裝置的使用者是不自動開所有11F 04/14 16:39
zoriyah: 安安 我是那篇的原Po 我昨天就有想過這個問題 一篇爆文12F 04/14 16:39
i4303348: 問個 每張圖一定是新上傳的嗎13F 04/14 16:39
emptie: 的圖14F 04/14 16:39
zoriyah: 通常大家會看到幾樓 感謝你分享資訊 解答我的疑惑哈哈15F 04/14 16:39
gokaze88: 推XDD16F 04/14 16:39
zoriyah: 不小心按到噓推回來17F 04/14 16:40
tim32142000: 突起點可能是那張圖還有被放在其他地方18F 04/14 16:41
z010529: 推19F 04/14 16:41
werlight: 推20F 04/14 16:41
missingkid: 我看了三小21F 04/14 16:42
ppt0726: 滿有趣22F 04/14 16:42
menshuei: 被大量投送了吧,而且黑白照片檔案小很容易就被使用者23F 04/14 16:43
menshuei: 抓下來了。
Neap: 推分析25F 04/14 16:44
leocean9816: 就前87樓的推文比較會被看到26F 04/14 16:44
korgh413: 抓到了!凱留是亂源27F 04/14 16:44
Strasburg: 對 應該是很多篇都留言在洗那張圖28F 04/14 16:44
howarddddads: 推29F 04/14 16:45
vin312789: 優文30F 04/14 16:45
BingLing: XD31F 04/14 16:45
tom282f3: 為什麼https會比http快 還以為加解密需要多花時間32F 04/14 16:46
three88720: 凱留:我在上,你們在下,你們都是我的身體33F 04/14 16:46
howdiee: 圖片被大量到不同文章投放吧 畢竟沒有專一性34F 04/14 16:46
lwrwang: 推35F 04/14 16:47
wbreeze: 有趣36F 04/14 16:47
qwefghzxc: 凱留的應該是本來就有上傳的 複製網址貼過來而已37F 04/14 16:49
soysfox0421: 優文38F 04/14 16:49
feeder5566: 凱留可愛39F 04/14 16:50
superpaden: 優質文章  推推40F 04/14 16:50
bnn: 你這個不包括盜文網站抓取的時間狀態,比如撈文時還只有100樓41F 04/14 16:51
jacky32120: 推42F 04/14 16:51
bnn: 那麼前100樓的imgur瀏覽量額外獲得從那些農場的數量會斷層43F 04/14 16:51
paul40807: 笑死44F 04/14 16:51
kcf004152: 優文推推45F 04/14 16:51
snio2427: 笑死46F 04/14 16:52
nomorepipe: U文 凱留47F 04/14 16:53
Superleggera: 凱留出來48F 04/14 16:53
longkiss0618: 優質文章49F 04/14 16:53
hancookie16: 尼豪膩害><50F 04/14 16:53
ghan: 優質51F 04/14 16:54
shiwa: 哈哈很有趣欸52F 04/14 16:54
castleoac: 莫名覺得凱留超好笑XD53F 04/14 16:54
[圖]
 
LeafLu: ptt沒有留言"讚" "噓"數的確有這樣的趨勢 不過我以為最下55F 04/14 16:55
h25949: 推56F 04/14 16:55
LeafLu: 面的樓層應該會提升57F 04/14 16:56
a23644910: 推 預定諾貝爾獎了58F 04/14 16:57
ethan30213: 街頭霸王那個很簡單阿就不只PO在那篇底下59F 04/14 16:58
kersihi: 分析給推XDDDD60F 04/14 16:59
BMI100: 研究這個要幹嘛?61F 04/14 16:59
BMI100: 拿搞笑諾貝爾獎?
fragmentwing: XDDDDDD 西洽的話大概50推10000觀看次數63F 04/14 16:59
jojojen: 有凱留有推推64F 04/14 16:59
qwefghzxc: google "http://i.imgur.com/h59bCX6.jpg" (含引號)65F 04/14 17:00
BMI100: 凱留傲嬌可愛不行膩66F 04/14 17:00
qwefghzxc: 會發現他有在一片台北低溫的新聞中貼同一張圖,而且在67F 04/14 17:00
qwefghzxc: 買前面的樓層,應該是這個原因造成瀏覽數特高吧
menshuei: 其實這樣也不準吧,因為很多推文或是對文章有興趣的人69F 04/14 17:00
swera: 幹我快笑死70F 04/14 17:00
menshuei: 會在前期來回刷同一篇文章,追蹤推文。71F 04/14 17:00
qwefghzxc: 滿前面*72F 04/14 17:00
l810502: 這分析滿有趣的,要不要寫個paper啊73F 04/14 17:00
a2470abc: lazy loading 這點要考慮74F 04/14 17:00
Asato163: 優文推,有時間的話樓層都會瀏覽完,因為網軍跟黑名單的75F 04/14 17:01
bomda: 凱留XD76F 04/14 17:01
Asato163: 關係前面樓層反而會先跳過XD77F 04/14 17:01
joker2340: XD78F 04/14 17:01
kevin870325: 推,看八卦長知識79F 04/14 17:02
likeyousmile: 能改用對數軸嗎?這種曲線用對數座標好觀察得多80F 04/14 17:02
fan5566: 你就是凱留吧81F 04/14 17:03
[圖]
 
renna038766: 推研究精神83F 04/14 17:06
AprilMight: 推分析84F 04/14 17:08
p2p8ppp: U文85F 04/14 17:08
KennethC: 值得推薦86F 04/14 17:09

--
※ 看板: Gossiping 文章推薦值: 1 目前人氣: 0 累積人氣: 375 
分享網址: 複製 已複製
( ̄︶ ̄)b cxzzz 說讚!
r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇