为何线上评价总体来说并不公正且容易被操纵

　　东东导读：研究表明，线上评价是消费者在进行电子购物时最信任的消息源之一。但最近有调研显示，线上评价总体来说并不公正，而且很容易被操纵。文章有点长，请慢慢品尝。
　　几个月前，我去纽约格林尼治村的 Dojo 餐厅吃东西。我对这家餐厅有自己的看法，毕竟我已经在那里吃过、体验过了。食物还行。服务也还行。总体而言就是不过不失。
　　于是我去 Yelp（译注：类似大众点评网的产品）给这家餐厅打分，我对于该打几星有明确的想法。我登录之后去到这家餐厅的页面，按下按钮，开始写评论。在打分按钮的右侧，我看到一位名叫 Shar H. 的用戶用优美的语言谈论着 Dojo 那＂新鲜美妙的甜品姜饼塔＂，在她的评论上方是闪闪发亮的五颗星星。
　　我动摇了。之前我觉得这家店可以打三星，但 Shar 说得有道理：＂良心价格！＂
　　她的评论影响了我。我最终给它打了四星。
　　我发现自己的行为并不少见。事实上，社交网站上他人的意见会极大地影响线上评分。而它却是最受电子商务消费者信赖的消息源之一。
　　羊群心态是问题所在
　　数字时代，他人的见解向洪水般涌来。我们在亚马逊浏览书籍时，同时面对着其他顾客对某本大作的好恶。我们在 Expedia 根据其他用户的评分选择酒店。我们在 YouTube 根据视频旁的那个竖起或向下的大拇指决定它是不是值得看。我们甚至会根据其他病人的反馈来形成对医学专业人士的意见。
　　在大多数情况下，我们对这些评分有信心，我们相信它。2012 年，尼尔森调查机构采访了 56 个国家的超过 28000 位网民，发现线上点评是第二类最受信任的有关品牌的信息（第一是朋友与家人的推荐）。根据这次调查，全球顾客中有超过三分之二表示他们信任这些线上平台中的信息，这一数字在四年中上升了15%。
　　但这种信任或许用错了地方。问题的核心在于我们的羊群心态──人类天然缺乏自主决策能力。羊群心态令我们和周围的人想得一样、做的一样。举例来说，2013 年 4 月里的两天，金价发生了三十年来从未有过的大跌。彼时，市场观察家们给出了各种各样的解释，但没有哪种解释特别具有说服力。＂结论只能是：黄金投资者甩卖是因为看到其他投资者在甩卖──换句话说，是羊群心态在起作用，＂英国《金融时报》的莎拉·哥顿写到。
　　社会压力造成的偏见
　　在羊群心态之外，还有我们对正向的＂社会影响＂的屈从。当我们看到别人欣赏一本书、享受一家酒店或餐厅、或是赞扬某个医生，并通过线上点评的方式对这些人或事物予以回报时，我们也会对这些书、酒店、餐厅或医生产生正面情绪，从而为它们在网上打出高分。
　　最近，我和两位同事一起设计了一个简单的随机化实验来研究某家社交新闻聚合网站。他们两人分别是耶路撒冷商业管理学院希伯来大学的高级讲师莱夫·穆许尼克和纽约大学斯特恩商学院的博士生肖恩·J·泰勒。（关于实验的详细信息请参看＂关于本研究＂。）用户可以在这家网站上根据自己的喜好给新闻报道与评论文章投支持或反对票。我们会通过投票随机地操纵分数。点向上的箭头表示＂用户＂喜欢这篇报道，点向下的箭头表示他不喜欢。接下来，我们测量了这些小规模的操纵对后续评分的影响。
　　结果令人惊讶。正面的操控在五个月时间里营造了正向社会影响，最终将整体评分提高了 25%。而负面的操控则受到＂修正效应＂的影响而被中和了：虽然用户看到负面评价也更容易打出低分（羊群效应），但他们看到自己觉得并没有那么差的新闻受到差评时会愿意＂修正＂这种评分。
　　这种社会压力造成的偏见会像滚雪球一样，导致不成比例的高分以及盲目的正面点评。我们对其进行了正面操控的点评最终达到或超过 10 分的几率比没有被操控的点评高出 30%。达到 10 分不是小事：那个网站的平均分数是 1.9。一票赞成影响的不仅仅是平均分，也会推高分数曲线最高的那一端。换言之，初始的一票赞成可以成就文章的热门地位。
　　盲目点评
　　最近有几个研究小组都发现了线上点评的盲目性，部分科学家称之为线上点评的＂J 型分布＂。上述结论可以解释这一现象。我们发现线上点评里正面评价的数量会高得不成比例。Amazon.com 上的产品评价里，五星（极度正面）的比一星（极度负面）和三、四星（基本正面）的多得多。在其它网站上对餐厅、电影和书籍的评价也有类似的趋势。
　　我们在实验中观察到的社交影响带来的偏见可以解释以上盲目性。假如他人的正面意见比负面意见更容易影响我们，盲目点评就可能源自我们更倾向于他人的正面意见这一本能：我们会群聚于正面意见之下，对于负面意见则保持怀疑态度。
　　在一项关于线上点评的倾向性的研究中，研究院胡南（音）、保罗·帕夫落和詹妮弗·张进行了另一项小实验。他们邀请一群学生到实验室里为一张 CD 打分。CD 是随机从亚马逊挑选的，事后研究员会将学生们给出的分数与这张 CD 在亚马逊网站上的评分进行对比。这个实验是为了了解随机挑选的小样本实际意见（大学实验室里的 66 名学生）与亚马逊上的评分的吻合程度。结果令人困惑：学生们的评分很正常，呈现出标准的钟型曲线：中间高，两头低。（说明两星、三星和四星评价居多，一星和五星的是少数。）而亚马逊上的评分则呈现为 J 型曲线（五星几乎是一星、两星、三星和四星总和的两倍）。
　　对此，作者们的解释是亚马逊的顾客更容易给出高分，因为他们已经主动购买了该产品，从而造成了选择偏差，导致正向评价。假若点评者都是购买了产品的人，并且他们也都更倾向于给出正面评价的话，选择偏差可以为 J 型曲线提供良好的解释。但有一个问题：没有在亚马逊上购物的顾客也可以点评。于是我就在想本次实验里点评者有没有事先看到已有的点评？研究报告没有提到这一点。我写信给作者询问，他们表示没有给点评者看对这张 CD 已有的评价，社会影响并非他们此次研究所涉及的范畴。换言之，他们模拟的那个环境和亚马逊上的评论环境很相似，但重要的区别在于点评者在评论前看不到已有评价的分布或是关于已有评价的任何信息。
　　在这一语境下，我重新考虑了自己给 Dojo 打出的四星评价。要是我没有看过其他点评者的好评，还会给四星吗？在看到那些评价之前我是打算给三星的。我在想：会不会每个人的点评都会受到社会压力的影响，从而更加倾向于正面？
　　造成线上点评呈 J 型曲线的因素可能有很多：选择偏差、作弊、或是社会压力偏差。这些过程都有可能造成盲目点评。但社会压力偏差最大的问题是会造成连锁反应：一则虚假的好评造成的影响是连续性的，它会极大地影响未来的评价。单是这一点已经十分惊人了。想想看：即使网站不断监测虚假评论并将它们删除，它们仍然会影响未来的真实点评。这一类的伤害是很难消除的。
　　可行的解决方案
　　如何超越这些人性，从而减少欺诈和偏差，这还需要进一步研究。在线上评价系统全面、深刻地影响着消费者决策的今天，科学家需要研究这些社会流程的原理，设计师也需要创造出能够消除偏差、减少人为操纵影响的系统。
　　通常，虚假点评背后的利益动机和网站设计（或规则）一起造成了欺诈或盲目好评现象。我们可以比较一下 TripAdvisor 与 Expedia 两个网站。在 TripAdvisor 上，人人都可以发表评论，但只有通过 Expedia 订了酒店的顾客才能在 Expedia 发表评论。迪娜·美兹淋、雅尼夫·多弗和朱迪斯·雪瓦利亚主导的一份精彩研究显示，那些有更大动力提交虚假评论的酒店（由单一公司拥有的独立品牌）在 TripAdvisor 上比 Expedia 上有更多的五星评论。相反，不太需要提交虚假评论的酒店（主要指不太倚赖线上评论的连锁品牌，它们作假要付出的名誉风险较高）就没有这种现象。
　　网站的设计与策略也会影响点评。2013 年，Reddit 改变了其页面设计，为管理员提供了＂在评论发出后一段时间内不显示点赞次数＂的选项。Reddit 表示这一功能是为了＂最大限度地减少盲目跟风投票现象──无论是赞还是踩。＂股票市场也有类似的措施。举例来说，纽约股票交易所施行了某种下限规则，当单日跌幅达到一定程度时就闭市。这也是为了减少负面羊群效应。
　　这一切意味着什么？
　　管理者不论是作为商业领袖还是作为消费者都应该谨慎对待线上点评。对于正面评价保持健康的怀疑态度可以纠正社会影响造成的偏差，但这种纠正对于负面点评则是不必要的。除此之外，管理者在点评过程的初期还应该尽可能地鼓励与促进真实的正面评论。若能制定系统性的规则来刺激满意的消费者尽早点评，则可以改变未来消费者的想法，让他们对自己所点评的产品与服务产生更多正面感受。
　　除此之外，管理者应该考虑上述关于羊群效应与盲目点评的研究所带来的对公司策略的提示。羊群心态是系统性的，如果从宏观角度观察它，或许可以让领导者在线上点评以外的各种情况下得到帮助。（固然线上点评本身也是很重要的领域。）举例来说，若产权价格背后的运作机制与点评类似，管理者就应该留意羊群心态对公司股价的影响。
　　我们对研究结果背后的行为机制进一步研究之后，发现朋友之间的羊群心态更加明显，他们更容易对互相的正面评价跟风，当朋友的想法得到了负面评价时，也更容易去背后力挺他们。这意味着社交网络的结构可以帮助引导点评的结构。随着 Facebook 和谷歌这样的网站鼓励更多的社交性点评──朋友的＂点赞＂和＂+1＂，以及更多被朋友分享出去的广告──社交影响造成的偏差会更有可能造成盲目点赞行为。
网站目录投稿：冰云