2009年一月,在阿姆斯特丹举行了一个名为Recked的活动,活动由Wakoopa和Strands主办,旨在讨论工程师们感兴趣的推荐系统。在活动介绍的内容中,提出了一些公司对于建造有效的推荐系统必须解决的几个问题。 1.缺少数据 或许推荐系统面临的最大问题,是需要大量的数据,以便能形成有效的推荐。现在能给出最好的推荐的公司正是那些拥有大量数据的公司:google,amazon,Netflix,last.fm,这并不是巧合。下图是Recked活动中Strand’s的演示文档,如该图所示,一个好的推荐系统首先需要类目(种类)数据(从目录或者其它形式得到),然 后系统必须捕获并且分析这些用户数据(用户行为),然后,再应用神奇的算法工作。分析越多的类目(种类)和用户数据,系统越有可能生产好的推荐。但是,这 又是一个蛋和鸡的问题:要形成好的推荐,首先需要有大量的用户,这样才能得到大量的推荐数据。 2.不断变化的数据 这个问题由Clicktorch公司(一家做"智能推荐"的公司)的CEO:Paul Edmunds 在ReadWriteWeb网站的评论中指出。他在评论中指出:系统通常偏向于旧的数据而难以有新的改进。 这 方面的一个例子是David Reinke在StyleHop(一个时尚爱好者的社会团体)的博客上写道:"过去的用户形为并不是好的工具,因为趋势总是在不断变化"。很明显,运算方 法将很难或者不可能跟上时尚趋势。时尚-挑战人们-我接受时尚-依靠值得依赖的有时尚意识的朋友和家人,把衣服推荐给他们。 David Reinke说,"类目(种类)推荐行不通,因为有太多的产品属性,而每个属性(比如价钱,颜色,风格,面料,等等)在不同的时候对于消费者的重要程度都是不一样的",他指出,社会化推荐可能可以"解决"这个问题。 3.不断变化的用户喜好 提出这个问题的仍然是Paul Edmunds,他认为问题在于:今天自己浏览amazon时是会有特定意图的,明天或许会有另一个特定意图。举个典型的例子:有可能某天我会上amazon为自己买本书,但第二天我到amazon的原因可能是要为姐姐找一份生日礼物。 对于用户喜好,推荐系统也可能错误的标注。华尔街杂志2002年有一篇文章"如果TiVo觉得你是个同性恋,这就是把你标注成同性恋的方式" 4.不可预知的类目(事项) 我们都知道,Netflix花100万美元来奖励能提升推荐引擎质量10%的人。我们注意到对于一些古怪(特别)的电影会有一些问题,有一些电影观众对它又爱又恨,比如:大人物拿破仑。这种类型的电影是很难去做推荐的,因为用户对它们会有各种反映而且无法预计。 音乐中就有很多种这样的类型。你能猜出来某个作者同时是卡彭特和金属乐的爱好者吗?Last.fm可能需要这种推荐 5.这个东西是复杂的 我们可以很简明的描述,但是从下面这张Strands的演示PPT截图可以看到,哪怕是最简单的推荐,也需要涉及到非常多的参数和变量(而且我们想象到的这些只涉及到系统表面) 到目前为止,有很多公司都已经建立起了用户满意程度较高的推荐引擎系统—amazon,Netflix,google这些名字跳入脑中。但是相对我们想 到的这些少数成功的案例,还有其它成百上千的网站和应用,都在寻找推荐新产品和新内容给用户的道路上挣扎。的确,在ReadWriteWeb,我们更希望 读者在网站上点击发现更多其它的内容,我们使用很多种插件和方法来达到这个目的,但目前我们并不满意