App Store 无用评价过滤

作者:Windson Yang
更新时间:June 20, 2019
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明 www.enginego.org。

App Store 的垃圾评论不是一天两天了,垃圾短信

苹果的不作为

我不清楚为什么苹果并没有用心在过滤垃圾评价这里,垃圾评价多得我几乎找不到正常的评价,而且我在美国区的 APP STORE 找不到这些情况,我不确定是因为美国区刷评价情况比较少(但是 刷亚马逊评价的多得一塌糊涂,即使现在比较少,将来刷评价的也会多)还是苹果放弃了这一块。苹果或者觉得减少垃圾评价对它的业绩毫无帮助,作为一名开发者,当看到别的应用因为刷评价排到搜索的前面而自己却在后面的时候,很难开心得起来。这篇文章让我们用一些简单常用的方法来识别垃圾评价,顺便学习下数据分析吧。

目标

看起来我们的目标很一致,过滤垃圾评价,保留正常用户的真实评价。不过这里对于“真实”可能大家的理解不一致,每个用户的背景以及受教育程度同,评低分的原因也各不相同(有的可能因为这个应用要求评分就评低分,有的可能仅仅是发泄情绪,有的为了让评论能置顶所以评5星,但是里面的实际内容却是差评),所以这里我们的目标并不是筛选海军/机器人刷的评论,而是找出对用户最有用的评论,这里在 App Store 的默认评价也可以看到,虽然,往往出来的都没有用。

app_store_most_useful

结果

虽然最终我们会通过我实现的代码来找到这些有用的评价,但是代码以及算法本身却不是最重要的,如何理解数据并且懂得对数据进行不同维度的分析才是最应该学习的地方,这篇文章不会涉及太多代码以及技术细节,你们可以把它当成一个即开即用的工具就好,问题是如何使用这些工具,以什么顺序,什么方式来使用,如何测量最终的结果。

有用的评价

直接想什么是有用的评价可能不是太容易,我们先判断什么是没用的

  1. 评价字数过短或者过长的

![]() 这点一开始大家不一定认同,不过我们对比下知乎以及Quora,你会发现知乎上有非常多抖机灵的回答,通常依旧是一两句话。但是 Quora 却规定回答必须超过一定的长度,硬性地确保回答的信息量达到一定标准。虽然这是产品选择的不同,不过从一定程度也能够杜绝一些纯粹发泄情绪或者无用的评价信息。同样,防止过长以及不相关的评价是防止用户在发现限制后乱填内容,我们也能通过其他方式来检测到。或者说,就苹果现在的情况来说,越少的评价反而更好。

  1. 语法错误问题严重的,语句不通顺

![]()

这点我想大家没有异议,语法错误严重的,语句不通顺代表没有深思熟虑思考过就提交的。

  1. 评价与应用主题不相关的

![]()

  1. 评论本身重复程度过高

  2. 评价之间重复程度过多

![]()

  1. 打广告的,让大家去哪里下载什么的

![]() 这个防止恶意刷评价(无论是刷自己还是刷竞争对手)

当然,还有其他标准,这里只列举最常见的几种。中国区的评价数量都较多,我们可以列举最有用的50条评价,我想已经足够大家去了解这个应用的情况。让我们一条条来分析,