rating に基づく正しいランキング方法

http://www.evanmiller.org/how-not-to-sort-by-average-rating.html

amazon のようなユーザが商品に対して点数をつけることができるサイトでユーザの採点に基づいて商品のランキングをつけるとする。さて、どのように順位を計算すべきか?というお話。

  • 方法1:positive rating - negative rating。この方法は1000人がgood, 900人がbadと採点したときと100人がgood,0人がbadと採点したときとを同一視してしまう。
  • 方法2:postive rating / negative rating。この方法はgood:bad = 100:10 よりも good:bad = 1:0 のほうを重視してしまうという問題がある。
  • 方法3(正しい?方法):Wilson score confidence interval(信頼区間) を用いる。数式はURL参照。