作者 gyboy38 (boy都不boy了)
標題 [討論] 建立一套基於「相對排序」的咖啡評分系統
時間 Thu Dec  4 09:00:30 2025


大家好,我是初心者咖啡gyboy。

最近在思考,如何建立一個具有參考價值的「評分系統」,只針對我自己品項的封測。

雖然像 Coffee Review (CR) 或是 SCA 的評分系統很專業,

但對於大部份的消費者(包含我自己)來說,

沒受過專業訓練,喝一口就判斷這杯是 85 分還是 86 分,其實非常困難。

「打分數很難,但比較誰好喝,似乎容易多了。」

基於這個想法,我試著設計一套「將排序轉化為分數」的方式。


核心概念是:不打絕對分數,只做相對排序。

日前我請Line群組內喝過我們家豆子的朋友協助做了一次封測,

google表單如下,您如果有喝過也可以協助填寫,分數會滾動調整:

https://forms.gle/sHUkz6Xvo6Ceu9jQ7
初心者咖啡 - 品項排名
請大家針對曾經喝過的品項,幫我做排名,請填寫有喝過的品項即可,謝謝。
以風味為主,盡量不要考慮價格、處理法等,單純靠直覺排序即可。
我希望能藉由排名,統計出各品項的分數,建立評分基準。
之後上架的新品項,我就能根據這個基準,先給一個分數,給大家初步參考。
有喝過的朋友再給新品項評分,匯入大家的評分, ...

 


以下是計算邏輯,簡單寫出來,大家幫我想想看,

這樣的統計方式是否有盲點?看能不能修正得更好。


計算邏輯(1):

由於不見得每位朋友都喝過所有的品項,

所以這套系統「未列入排名的品項,就不列入計分」。


計算邏輯(2):

找出該名測試者排名列表的「中間值」品項,作為基準,設為0分。

比中間值好喝的,依序 +1, +2, +3...

比中間值難喝的,依序 -1, -2, -3...

最終分數 = 總得分 / 實際評分人數

【舉例說明】

狀況一:小明只喝過3支,給出的排名是 A > C > D

C 是中間值:得 0 分

A 比 C 好:得 +1 分

D 比 C 差:得 -1 分

狀況二:小美喝過5支,排名是 B > C > E > D > A

E 是中間值:得 0 分

C (+1)、B (+2)

D (-1)、A (-2)

【結算】

A 品項: 小明給 +1,小美給 -2。 總分 (1 - 2) / 2位評分者 = -0.5 分

B 品項: 小明沒喝過(未評),小美給 +2。 總分 2 / 1位評分者 = 2 分


為什麼要設計成「兩面刃」機制,拿下大量負分的品項會沒人買吧?

我的想法在於「避免分數膨脹」與「強迫取捨」。

以google地圖的1~5星評分來說,店家沒什麼大問題通常會給4~5星,

導致鑑別度喪失,何況還有五星好評送小菜 =.=

對我來說,這個評分就一點意義也沒有了。


當你覺得某支豆子超好喝,給它 +3 分的同時,依照排序邏輯,

你勢必得把某支豆子排到後面,給出一個 -3 分,是一個零和遊戲。

你不可能讓所有豆子都拿高分,評分者必須誠實面對自己的喜好排序。


即便是身為烘豆師的我,把自己所有品項拿來排,

不管我多愛某支豆子,我最多也只能給出 +3,同時我也必須忍痛給出一支 -3。

每一支品項都是我從大量樣品杯測,謹慎出手買進的,當然不會有不喜歡的。

但排名就是這樣。


大家可以想像,當參與評分樣本數夠多時,這個分數會非常有公信力,

可以說是殘酷擂台,因為合計之後能拿到正分的品項,

代表它必須是大部分人心目中的「前段班」。


第一波封測的計算結果:

以我們家比較多人喝過的「衣索比亞 吉茶 水洗」 來說,

他在這次的封測評分中,只拿下 -1.7 分(3)。

後面的(3),表示總共有3個人給出排名,對這個品項產生影響力。


這代表在受測者的心中,吉茶普遍被排在比較後面的名次。

雖然我覺得吉茶也算滿不錯的衣索比亞 水洗豆了。


類似群眾募資的概念,只是我需要的是你舌頭的支援 (聽起來怪怪),

系統建立起來之後,就會有一個比「老王賣瓜」更客觀的參考依據。

不知道大家對於這套「排序轉積分」的邏輯,


有沒有什麼盲點,或不合理的地方? 歡迎給我建議,謝謝大家。

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.223.59.75 (臺灣)
※ 作者: gyboy38 2025-12-04 09:00:30
※ 文章代碼(AID): #1fCDqnUI (Coffee)
※ 文章網址: https://www.ptt.cc/bbs/Coffee/M.1764810033.A.792.html
hesione: 範圍小 大家喝過的東西都差不多可以 但範圍大時間一長 等於要人記得之前所有喝過的給出"相對"高低  這大概比單純給分的信度還低
問題如果只針對單一廠商/店家的商品 那意義也不大1F 12/04 09:07
soulivee: 先有話語權,資本力量支持,做這些才有人買單5F 12/04 09:30
jakkx: 就算是哈曼曲線也只是廠商做大眾化產品的依據。不過這對"你的客群"倒是應該有統計上的資料意義6F 12/04 12:32
masonyrs: 推用心 買過幾次評價都很不錯8F 12/04 13:42
gyboy38: 感謝各位大大的建議與鼓勵,之後google表單的統計,會調整為最近的5~7個品項。這個系統主要是給原有的熟客做參考,可惜沒辦法做到像CR那樣能,同時適用於熟客、新客戶9F 12/05 07:55

--
作者 gyboy38 的最新發文:
點此顯示更多發文記錄