【摘 要】在当下这个信息时代,技术革新在社会中起到关键性作用,推荐系统的不断优化推进着电子商务模式的变化和发展。在近些年来看,在人民生活水平不断提高的大环境下,更希望去外面的世界走一走看一看,也就是旅游,因此,人们对于旅游时间和目的地选择、旅游产业个性化推荐的需求成明显的上升趋势。传统实体旅行社显然不能满足如此大规模的需求,所以,国内许多电商网站优势尽显,如携程、途牛、飞猪等等,他们依靠着搜集相关的大数据及算法运算,为人们进行更加个性化更加精确的旅游项目推荐。 【关键词】情感分析;个性化推荐;协同过滤 一、问题研究背景 在当下复杂的网络环境下,对于消费者或是客户来讲,可供选择的信息量非常庞大,而且信息使用者的数量也呈现出明显的上升趋势。在许多情况下。用户并不知道应该以什么标准进行比较并做出选择,举例来说,用户只知道自己想出境旅游,却又不知道自己想去哪个国家,哪个国家适合现在的自己去。此时,传统实体旅行社的推荐显得千篇一律,而大数据时代下的电商网站,恰恰做到了帮助用户以适合自身的标准进行筛选,避免了用户的盲目查找,而是能为用户提供最直接最有效的信息。 二、协同过滤推荐算法研究及改进 传统的协同过滤算法主要有三种:1、基于用户的协同过滤算法;2、基于项目的协同过滤算法;3、基于模型的协同过滤算法。传统协同过滤技术主要依赖于用户和项目之间的相似性,对不同用户进行推荐,因其对推荐的对象要求极低,可以处理各种结构化、非结构化的内容,而一直在推荐领域被广泛运用。随着技术的发展,面对海量的数据和结构多样的内容,简单的协同过滤算法已无法人们的需要。 本文主要对基于用户的协同过滤算法进行改进,对其只考虑项目和用户之间简单关系的弊端进行改进,引入用户和项目偏置,考虑用户和项目之外的因素。例如,标准较高的用户给分会偏低,而标准较低的用户则给分较高。另一方面,网络的发展,使得求好评的商家日益泛滥,而许多用户更是习惯于给满分,而把真是情感寄托于评论中。为了更好的解决此类现象给结果带来的偏差,引入偏置,重新计算用户评分。用户评分,用户平均评分,用户情感得分,用户评分新得分为: 在用于计算的用户-项目矩阵中,将用新评分替代原始评分进行预测,考虑了用户个人属性以及情感倾向的协同过滤算法将更加个性化,也更符合用户需求。 三、基于评论的情感分析技术研究 随着自然语言处理技术的发展,情感分析的需求日益旺盛,传统的情感分析方法主要是基于词典的分析方法,现代衍生出越来越多的基于机器学习的分析方法,最主流的即基于RNN的情感分析方法,但是随着数据量级数增长,RNN的运算速度受到很大影响,而LSTM网络模型的诞生解决了这一问题,不仅具有更快的效率还具有更高的准确性。 LSTM网络比RNN网络多了一层cell state,相当于模型中的记忆空间,是随时间变化的,LSTM网络的关键就在于拥有忘记门,能控制训练时梯度的收敛性,更好的保持长期记忆。 LSTM网络相比传统RNN网络具有多条线路,上边红色椭圆内即为cell state (单元状态),控制信息的传递,它第一步用sigmoid决定什么信息可以通过cell state,第二步是接收新信息进行更新。这个过程分为两部分,首先,用sigmoid函数来决定更新哪些值,然后,再用一个tanh层生成新的候选值,这个候选值将被当成当前层的候选值添加到单元状态中。我们会对这两部分的值相互整合,并进行更新,丢掉不需要的,添加新信息。 为了更好的进行模型的输出。首先,要通过sigmoid层产生一个原始的输出,然后使用tanh函数对其值进行缩放,使其范围在-1到1间,再与sigmoid层得到的输出对应相乘,从而产生模型最终的输出。 四、数据集分析研究 本实验采用的数据集为爬虫爬取的携程网8万多条数据,数据结构如下表所示: 本文先对数据进行处理,生成如上图统一格式,再对用户评论进行提取,进行情感分析,所得评分再与用户项目评分进行加权,得到新评分,最后进行基于用户的协同过滤推荐产生推荐结果。此种方法相较于传统协同过滤算法更加考虑个性化因素,推荐结果也比传统协同过滤算法更优,达到了较高的精准率。 五、结束语 如今个性化推荐被广泛普及和应用,本文在协同过滤算法的基础上,考虑了用户对参与过的旅游项目的情绪,提出了关于用户在评价旅游项目时是处于一个以情绪为主导的综合的情境之中的概念,同时也对基于情感分析的个性化旅游项目推荐进行了严密深入的探讨,通過建立LSTM模型,分析用户情感,进而建立新的协同过滤方法,并用该模型合理谨慎地对携程旅行的数据集进行实验,所得结果较传统方法更优。由此可以对用户更加负责地进行更精准、更加个性化、更能令人满意的相关旅游项目推荐。