豆瓣电影打分规则竟如此简单粗暴……

当人们需要对一部电影的好坏做出评价的时候,通常会查找这部电影在影视行业通用标准下的得分。在全球,参考标准一般来说是 IMDb(Internet Movie Database),而在国内大部分人都会相信豆瓣电影和时光网。

你可能以为,来自这些评分标准机构的专业人士们,会使用复杂的加权机制、算法,抑或多重计算标准,来对一部电影进行多维度的立体打分,得出最客观的,最符合大众观影者认知的一个分数。

这的确没错,但并非所有的人们信赖的机构都是这样!如果不是因为今天豆瓣创始人杨勃(阿北)的一篇日志,大部分人可能永远不知道,豆瓣电影居然有着一个简单到不能更简单的评分计算机制:分数加总之后除以人数

日志的开头阿北这样写道:

我是豆瓣的创始人,也一直是豆瓣的 CEO。我还写过计算豆瓣评分的最早的几版代码(不难,加起来除下人数)。

在文章的第一个章节他具体解释了豆瓣电影的评分标准。仍然没多难,跟“最早的几版代码”几乎没什么区别:

比方说一部电影有 42 万用户打分。我们的程序把这 42 万个一到五星换算成零到十分,加起来除以 42 万,就得到了豆瓣评分。

很难想象,豆瓣电影这样一个在影视行业影响力如此之大的平台,评分机制竟然如此简单,简单到了粗暴的程度……

阿北进一步解释,这个评分会自动出现在豆瓣的各个需要豆瓣电影分数出现的地方,没有审核机制,更没有编辑干预,程序每过一段时间会自动重跑一遍,将新打分者打出的分数加入到计算当中。在他看来,豆瓣一亿多人的大众评审团的意义就在于此。

曾经作为豆瓣用户主力的中国文艺青年,数量显然比一亿多人要少。而这样的评分机制,使得豆瓣电影评分已经不再体现文艺青年的喜好,而是更能反映出大众对于电影的观点看法。一部文艺电影的得分高很正常,因为文艺青年们看过并都打了较高的分数。然而普通用户因为得分高也去看这部电影,结果觉得并不好看,进而觉得豆瓣电影不靠谱。

过去数年时间里豆瓣用户量剧增的同时,无论文青用户还是普通用户都有这样的感触。自己喜欢的电影得不到高分、自己不喜欢的电影得了高分,用户们因此产生了想法,认为豆瓣电影评分规则背后有阴谋。阿北指出,豆瓣电影并没什么阴谋,普遍观点和个人观点之间的不重合,恰恰是用户有主见的体现。

跟豆瓣相比,IMDb 作为中国大陆以外的观众最常参考的电影评分机构,在评选 TOP250 电影的时候却采用了一种繁琐的排名制度

imdb-rank

加权排名 = [经常投票者投票人数 ÷(经常投票者投票人数+进入 TOP250 需要的最小票数 1250)]×普通方法计算出的平均分 +[最小票数 1250 ÷(经常投票者投票人数 + 最小票数 1250)\× 目前所有电影的平均得分

通过这个复杂无比的计算公式,IMDb 的 TOP250 榜单能够排除掉那些只有极少数投票者且得分极高的电影,但又不会给那些投票者较少的优秀小众电影关上入选榜单的大门。

同时,如何将刷票行为排出到最终的分数外,关键点就在于“经常投票者投票人数”这个值上。具体来说,当粉丝为一部电影拉票的时候,号召非用户在 IMDb 上新注册用户并给一部电影打分,这些新增的用户,和 IMDb 上经常打分的老用户是存在区别的,前者打的分数可以显示出来,但只有后者的打分才能被有效计入到最终的榜单当中。

互联网技术专家和学者阮一峰曾经在他的博客整理过 Hacker News、Reddit 等一众带有非简单的贴文排名功能的社区产品,其背后所依赖的排名算法

比如,Delicious 曾经的热门书签排行榜,曾经使用过去一个小时内被收藏的次数进行排名,每小时重新计算一次。而 Hacker News 的机制类似,但算法稍微复杂一些:

hackernews-rank

(帖子得票数 – 1) ÷【 (距离发帖的小时数 + 2) 的 1.8 次方】

其中,1.8 次方被称为重力因子,代表着老帖子(无论排名高低)排名下降的速度,重力因子越大,排名下降越快。

此外,阮一峰还总结了基于曾由牛顿提出的冷却定律公式衍生出的排名更新规则。

无论是用极其复杂的算术公式来优化掉所有的干扰因素,还是粗放生硬地使用平均数来反映整体意见,排名规则最终总是要达到两个目的:

1)按照社区的定位,能够体现最广泛或最核心用户的真实想法

2)不易被主观带有恶意的规则破坏者所利用

这样来看,豆瓣的规则的确在第一条上做的很好。阿北也在前面提到的日志里解释,在针对有组织的非正常打分行为上,豆瓣也在使用程序来中和这些打分的体现效果。

反刷分早已经是豆瓣电影日常工作的一部分,不少同事借助更多的程序一直默默在做。

订阅更多文章