个性化推荐是根据用户的兴趣和行为特征,来推送出用户喜欢的东西。那么,这个个性化推荐是怎么做到的呢?其中包括哪些内容呢? 周六下午的时光是惬意的,小诺和女票来到了东交民巷比利时大使馆旧址,里面的餐厅喝下午茶。进去后,俩人忙各自的事情,女票在看晚上要去的餐厅,小诺拿出书和电脑学习,毕竟他是苦逼的产品狗。过了十几分钟,正在小诺看的津津有味的时候,女票探过头来,看到小诺在看《用户网络行为画像》和《推荐系统实践》,一脸嫌弃的说,你怎么又在看推荐的书? 小诺看着有点生气的女票,心里想:我可不是个直男,我得说的好听点。于是他故作深情地说:之所以我喜欢做推荐策略,是因为我想读懂一个人的心,然后把她最喜欢的给她。 只听啪的一声,女票给了小诺一巴掌,说:油嘴滑舌!你这么行,那你用你的策略预测下我晚上想吃什么呀? 小诺摸着滚烫的脸,脱口而出:你想去吃辣妹子火锅店。女朋友惊讶的说:你怎么知道?小诺故作冷静的分析:上周你就说想吃火锅,但没去成,所以肯定不甘心。刚才打车经过火锅店的时候,你扭头一直看,还说同事跟你说那家店不错。你又是个无辣不欢的人,所以你肯定想吃火锅。 女票说:原来这么简单啊,算你猜对了。小诺说:毕竟我是做推荐的,只要我有足够多的特征数据,我就能读懂世界! 女票白了一眼,说:这个不算,我们部门下周要去雾灵山团建,你给我推荐下我该带什么衣服呗。小诺开始分析:第一步我要理清我现在知道的信息,然后才能进行推理,最后给建议。 小诺总结的信息如下: 早上9点出发,高德查了一下开车去单程需要3小时。 他们到达先吃午饭,下午2点上山,有车送到差不多快到山顶,大概是2点30,然后自己再走一段路。 百度搜索雾灵山海拔2118米,海拔每升高1000米,气温下降大概6度,当然也受环境影响。 现在9月早晚温差较大,查了当天天气晴好,湿度应该不会很高,12-24度,日落时间18点05。 山上玩几个小时,5点左右开始下山,下山曲折路线较长,一边拍照一边走路,大概需要1个半小时到2小时。 走路会产生热量,体感温度会感觉热了2度左右。 综上推理,山顶温度在0-12度之间,中午2点最热的时候应该在12度,但天气晴好,山顶场地太阳直射,有太阳辐射不会感到那么凉,加上走路产生一些热量,所以感觉会在十六七度左右。 5-7点的下山过程中,太阳慢慢下山,温度会降低,热量更多,海拔降低,感觉会到13度左右。 最后小诺给出了建议,他对女票说:你外面多套个上周你买的驼色风衣就好,上山时放在包里,下山时温度开始降低时穿上风衣就够了。女票表示疑惑,小诺又详细解释了下。 女票开心的说知道了,然后说:淘宝真是个罪恶的app,每天都给我推送消息,害的我不停的买买买。这个是不是也是你做的推荐? 小诺说:对呀,我就是做的push的个性化推荐呀。 女票说:那你给我说说你们是怎么做的。 小诺说:那我慢慢给你道来…… 一、push目标和本质 首先什么是push消息呢?就是淘宝每天给你推送的那一条条消息。 那push的目标是什么呢? push的目标:新用户的拉新,和老用户的促活,包括流失用户的召回。 push推荐的本质:push是将合适的内容,在合适的时间,合适的场景下,推荐给合适的用户。 所以你每天就会收到很多push消息喽~ 二、商品画像和用户画像 这就是一个推荐的过程,我画的非常简单,其实真实的比这个复杂。 我们想把你可能喜欢的商品推荐给你,就要了解你和商品,所以我们要创建商品画像和用户画像。我们先来说说商品画像,商品画像如下,主要由sku分类和属性特征构成,须对这些特征建立倒排索引。 对于商品画像,商品上下架、库存、价格、评论数等应采取增量更新,商品标题、分类、属性、主图、销量、评论等应采取全量更新。 我们再来看看用户画像,用户画像就是通过了解你的一些信息,来定义出你这个用户是什么样子的。大概包括以下几个方面。 用户画像如下: 用户分群: ①在用户画像上,可以分为基本画像和模型画像。基本画像指的是可以直接获得的用户数据,模型画像指的是通过模型学习用户数据得出的模型,如用户流失级别,用户挑剔度等。 ②用户的基本信息属于长期画像,在长时间内是不会改变的。如用户的性别,年龄,星座等。对于基本信息不完整的用户,可以对信息完整的用户进行训练,得出不同用户群体的特点。 比如通过分析用户的applist,得出安装哪些app的用户是女性的概率是多少,男性的概率是多少,这样可以对性别缺失的用户进行模型扩散,补上缺失项。 ③用户的兴趣爱好可分为长期兴趣和短期兴趣,长期兴趣可通过分析用户历史数据进行积累。比如用户在过去半年经常性的买零食坚果,每次购买在长期兴趣上都会进行一个权重累计。 有一天因为用户受热点事件影响,开始在短期内买零食果脯,则模型应在短期内提高此兴趣点的权重,以便不受长期兴趣的影响而无法提高。 ④对于行为特征,消费信息等数据,可设计用户对比度,比如设置用户对比3家同类商品才购买1个为三级,用户对比5家以上相同商品才购买1个是一级。 也可以根据用户点开app频次设计用户流失模型,比如用户1天为打开是流失F级,3天未打开是流失E级,7天未打开是流失C级,一个月未打开是流失A级。 三、推荐策略和算法 我们建立了商品和用户的画像,就要来分析你喜欢什么样的商品,商品如何和你匹配上,这就涉及到了策略和算法。 (1)常用算法 ①基于统计学的过滤,如基本信息中的性别,年龄,地域等。 ②基于用户的协同过滤。 ③基于商品的协同过滤。 ④决策树模型等。 (2)推荐策略 ①applist:通过读取用户app列表,用app和商品分类进行匹配,了解用户的兴趣点,此策略针对于新用户的兴趣获取,以及老用户的新兴趣挖掘。 ②本地化:实时获取用户地理位置,与用户本地天气,城市层级,生活圈,本地热点等结合进行push推送。此策略为的是提升用户感知,增加推送好感。 ③通勤场景:在通勤中,用户如属于移动网络状态,push和落地页应减少插图或者多图的比例。此策略为的是考虑用户感受,增加用户好感。 ④兴趣试探:对于新用户来说因兴趣爱好信息积累较少,在push推荐时可选取热度高,点击率高,表现好的push进行推送,这样即使用户兴趣不增加,也保证了用户不产生厌恶。 ⑤负反馈策略:对于用户看到不点击,以及点击即退出的push,应该有负反馈机制,降低此类push在此用户面前出现的频率或者不再出现。 ⑥季节策略:可根据季节,天气,节气变化,针对性的向用户推送具有此类特征的商品。 ⑦热点策略:根据近期话题或事件热点,结合相关商品进行推送。 (3)分发排序 ①push可以分类型,如通用型,活动型,群体型,个体型,系统型,热点型。并给不同类型的push设定优先级。在推送时高优先级的push优先推送。 ②在召回排序时,通过第一层的统计社会学信息过滤,候选集中的push会存在多条,此时可根据以上提到的各策略模型综合的对push进行打分,比如有30个策略模型,可从30个维度按照不同的加权对push进行综合打分,由高到低的进行排序,得分高的优先推送。 ③当一天内的推送push数量达到3-5条的上限时,当天即停止推送。 四、push个性化推荐的衡量指标 那么当我们为用户推荐商品之后,如何来看我们的推荐效果呢,这里就需要有衡量的指标。 短期来看是push拉新数量,和拉新贡献度。 长期来看,是从推送,点击,到达,浏览,加购,下单,支付,复购整个链条来提高,为最后的GMV负责。 GMV=流量*转化率*客单价。流量=新用户+老用户。 从用户行为路径来看,一条push推送后,经历了,到达,展示,点击,浏览,加购,下单,支付的流程。评价push效果的指标也据此产生。 五、push优化方向 按照以上指标,我们需要对以上几个方面进行优化。 (1)提升push的到达率 重复发送push:通过服务端重复发送,客户端本地排重来实现到达率优化。 重复发送策略,可以分次分时间间隔发送,如每隔x小时,发送y条push,每天发送z次。 (2)提升push的点击率 增加push的丰富度。如针对活动和热点事件的全量推送;针对某用户群体的群体推送;针对单个用户历史信息和兴趣爱好的个性化推荐。 塑造具有吸引力的文案。对于某个push,可以设置多个文案,用ABtest的方法,将同质用户分组,推荐同一个push的不同文案,快速获得点击率高的文案进行全量发送。 push文案设计:应从文案基础,用户感知,用户习惯,形式多样性等方面考虑。具体如下。 文案基础:无错别字,无错误标点。主语突出,无无意义词语冗余。文案完整,或主述对象完整,文案过长可末尾用省略号提示。 形式多样性:图片,文字,表情,提示音等,丰富push形式。 用户感知:比如让用户有参与感的有,含有当地名,@用户。让用户有亲近感的有,熟知人名,电影电视名。以及关于热点热句的文字。 用户习惯:如习惯看半角文案,因为全角文案会有不正规的感觉。 (3)落地页设计 ①落地页内容和push内容应该保持一致,相辅相成。 ②落地页内容应该突出商品主体,抓住用户眼球。 ③对于新用户来说,因使用习惯还未养成,对app了解度也还不够,落地页最好有一定的指引,引导用户理解产品。 (4)Push的频控设计 主要是为了不过度打扰用户。 ①push对于每日每个用户的推送条数应该有上限的设置。比如系统消息或者互动消息类的push可以无上限,活动和个性化推荐类的push总量应控制在3-5条。 ②push推送的时间段应选择用户的空闲时间,一般分布在早,中,晚,睡前四个时间段。如7-10点,11-14点,17-19点,22-24点 ③从长期来看,可以通过模型,算出用户一般每日可接受的push条数,以及单个用户可接受的push条数。 小诺说:好啦,我讲完了~女票说:我脑子嗡嗡的,就听懂个大概。 最后 醒醒醒醒!做策略的哪来的女票?还是滚去学习吧……