互联网科技的恐怖之处不在"窃取"我们的隐私,而在于那些打着"给我更优质服务"旗号的所谓人工智能算法正在不断侵蚀我们的心智,影响我们的决策。 最近两天关于互联网科技产品明目张胆或暗度陈仓的收集用户隐私的文章在不断的爆出。不管是由于量变终于带来了质变的用户意志觉醒还是自媒体人无聊的自造热点,不得不承认,近几年互联网产品在收集用户信息方面愈演愈烈。除了技术的进步带来的收集能力提高以外,越来越被大量应用的人工智能推荐算法也是促使各互联网产品费尽心机去收集用户信息的重要推动力。 我们今天要讲的,就是收集了用户信息(不只隐私信息)后的推荐算法,它们或许正在悄悄的通过各种我们无法感知到的方式影响我们的决策。 从一个情感实验说起 Facebook曾开展过一项为期一周的试验,研究人员以68,9003 名Facebook用户为试验对象,每天向他们推送具有特定情绪倾向的内容。有一些用户看到的主要是积极和快乐的内容,而另一些用户看到的主要是负面和悲哀的内容。 当实验结束时,这些被当作"小白鼠"的不知情用户的发帖行为已经发生了相应改变:每天看到积极内容的用户更有可能发布积极的消息,而那些每天看到消极内容的用户更有可能发布消极的消息。 也就是说,Facebook可以操纵用户的情绪。 或许你会认为,这项实验中因为有了研究人员的人为干扰,"算法"才会向用户推荐了具有特定情绪的内容,我们当前所使用的各种资讯平台在没有"研究人员"干预的情况下,不会主动控制我们的情绪。是的,我们的情绪确实没有被控制,但我们的认知或许正在被潜移默化的改变。 你会担心自己变LOW么? 认知的改变是一家比情绪改变更危险的事情,情绪可以通过外界环境的改变快速调整恢复,而认知一旦被降低,就很难自动恢复到初始水平。 曾经有很长一段时间,我们使用的各种算法分发新闻APP被吐槽推荐内容过于低俗,开始各平台还会说这是孤立样本,千人千面的算法会根据读者的喜好精准推荐,看到低俗内容不是平台造成的(潜台词就是用户自己低俗)。随着越来越多的人联合起来发出同样的质疑,平台不得不改口"会加入人工审核,提高内容质量"。 其实,推荐内容越来越低俗化恰恰是机器算法准确的表现,它发现了人性的弱点,找到了精准推荐的"窍门":擦边色情、低俗段子、标题党确确实实更容易吸引到用户的眼球,这些实实在在的点击量恰恰是对算法推荐的肯定,在没有人为干预的情况下,算法肯定会更加频繁的推荐相似内容。 当你看了越来越多被算法推荐的低俗内容后,你的认知和欣赏水平肯定会受到影响。我们不能说是机器算法错了,因为它们确确实实响应了读者的需求。 但是,最终受害的却是读者自己。 什么催生了你的购买? 内容平台的出发点肯定不是为了让用户变得低俗,平台只是想要获取用户更多的时间,以实现它们最开始的目的——广告。 媒体和广告之间的合作由来已久,从纸媒到电台到电视到现在的互联网,广告一直是媒体最重要的营收来源。只不过互联网之前的媒体广告对我们的购物决策并未造成太多的影响(除了重要媒体背书带来的信任感),而今的互联网广告却在越来越有效的影响我们的购物行为。 曾经在电视剧中间插播的广告让我们心生厌烦,但现在这些夹杂在feed流中的广告却受到很大一部分人的喜爱:因为它们刚好是你想要的。 喜爱之余,你有没有想过,它们是否真的是你想要的呢? 仔细想一想,广告前后的内容有没有恰好为你营造了购物氛围?你最近两天有没有恰好搜索过相关信息?你是否昨天把它放进了购物车但是犹豫后没有购买?如果是,但为什么昨天你还犹豫不决的购物行为,在今天读完几篇刚好相关的文章以后,你的购买欲大增呢? 算法在改变你的决策 去年6月份,我开始学习机器学习。这是一个非常好玩的学科,它的核心是数学里的概率统计。机器学习其实就是给定机器大量经过人工分类筛选的数据,让它分析学习其中的规律拟合得到某种函数,然后应用该函数去完成更多未经人工处理的数据分类工作。 推荐算法就是数据分类的一种应用。机器对人类预先给出分类的数据进行学习,"掌握"其中的分类规则后给新添加的数据打上相应的分类标签,比如内容平台里的"军事""科技"或者"母婴"等类别主题。对于算法内容分发平台,机器还有一项工作,就是对用户进行分类打标签,根据用户在平台的信息资料和行为数据,给用户打上和文章分类相似的标签。 完成了对内容和用户的分类后,机器就可以把具有相同标签的内容和用户放在一起,混合推荐。分发的过程中,机器也会通过用户的反馈(比如点赞、分享、不喜欢等操作)不断地学习,内容越多,用户反馈越丰富,推荐的准确度则越高。 所以你会发现,你在此类平台上阅读的内容越多,你看到的信息就越符合你的口味。 按照这个推荐逻辑,如果内容质量有保证的话,理论上我们可以更高效的获取信息,这是一件好事。但前面我们说过,平台方的根本目的并不是服务大众,他们的出发点是在占有用户足够多时间的基础上推送广告,广告肯定想要最大可能的促成交易。 仅靠用户在平台上的行为数据很难对用户的"购买欲望"有准确的了解,所以平台大都通过各种手段引入用户的外部数据来丰富机器对你的认知,比如你的搜索网站的搜索记录、购物APP的浏览历史,甚至你的输入法输入记录: 结合这些"场外"信息,机器能给你打上更"精准"的标签,然后推送更精准的广告信息给你,从而提高促成交易的可能性。这个促成交易的过程是通过大量周边信息的堆砌影响你的心智判断来完成,整个过程你并不知情,甚至乐在其中。 很多人会说既然享受了便利,付出一些总是应该的;也有人会说这种"未经许可"采集隐私的行为是有违道德伦理的。我不想在这里讨论技术和伦理相关的问题,只想提醒大家: 当你在一款被算法控制的内容产品里"遨游"时,请一定要谨记,你的认知可能已经被改变,你此刻的欲望可能正在被算法左右。