本文针对刚起步与用户量不大的UGC内容社区,分享了两种基于内容热度的推荐展示规则,同时结合了目前几大UGC内容社区案例进行展示。 首先科普一下社交产品、社区产品、UGC、PGC的含义: 社交产品:以沉淀用户关系链为主,体现在:如何让用户之间建立关系、保持关系、升华关系; 社区产品:以沉淀内容为主,体现在:如何让用户生产、消费内容,如何为用户呈现内容; UGC:指用户原创内容平台,如抖音、知乎、Instagram、小红书、IN; PGC:指专业化、规模化生产内容的平台,如爱奇艺、优酷、早期的腾讯新闻。 UGC内容社区信息流 以上分别为Instagram、小红书、即刻的内容信息流,分别代表了UGC内容社区三类典型的布局方式:纯图片信息流、图文缩略信息流、图文详情信息流,在数据层面它们都有一些相似特征: 每次下拉刷新内容会变化; 内容几乎不会重复出现; 内容的点赞、转发、评论等数据都相对较高。 以上方App内容信息流为示例,分享2个基于内容热度的推荐展示规则,适用于刚起步与用户量不大的UGC内容社区,抛砖引玉,仅供学习与交流。 热度随机曝光规则 方案目的: 热度高的内容应得到高曝光; 尽可能多的向用户曝光内容; 应用场景: 发现、推荐、探索类信息流。 上图是小红书的内容详情页,包含有点赞、收藏、评论、转发这些基本数据,所以我们需要拿到这些数据设计规则并进行排序计算,如果想把规则做得更精准,则可考虑把页面停留时间、页面跳出率等埋点数据纳入计算。 热度排序 首先判断:点赞数高低,更高的靠前; 如果点赞数相等:判断收藏数,更高的靠前; 如果收藏数相等:判断转发数,更高的靠前; 如果转发数相等:判断评论数,更高的靠前; 如果评论数相等:判断发布时间,发布更早的靠前。 排序规则的判断指标、先后顺序,都可以根据实际业务调整。 数据过滤 在所有作品中,取出发布时间在5天内的作品,挑入备选池; 对备选池里所有的数据,使用热度排序规则进行排序计算; 取出排序后数据中排名前20%的作品,挑入曝光池; 如果排名前20%的作品数量,不足曝光池限定的最小数量如400,则应把另外80%的作品,按排名依次填充到曝光池中,直到满足最小数量要求。 如果不设定曝光池的最小数量限制,则可能导致计算后的数据不足,内容无法饱和填充。 经过以上步骤,就过滤出了社区中一段时间内热度较高的作品数据,其中5天,20%,400这3个参数,可根据实际业务调整。 刷新机制 方式1:每 x 小时执行一次规则; 方式2:监控新作品增量,当增量达到 n 时,执行一次规则。 数据返回 每次请求的数据,都随机返回; 当分页数据被请求到末尾后,继续从数据头部开始返回,保持数据循环展示。 保证每位用户的每次信息流下拉操作,看到的都是随机数据,提高了曝光池中每一份作品的曝光几率。 如果有进一步精细化曝光的需求,则可以考虑对热度不同的作品分权重曝光,如在小红书信息流的示例图中,有8155点赞量的作品,也有30点赞量的作品。 方案2:历史热度排名规则 方案目的:根据热度展示内容与排名; 应用场景:热门类信息流。 热度排序 首先判断:点赞数高低,更高的靠前; 如果点赞数相等:判断收藏数,更高的靠前; 如果收藏数相等:判断转发数,更高的靠前; 如果转发数相等:判断评论数,更高的靠前; 如果评论数相等:判断发布时间,发布更早的靠前。 排序规则的判断指标、先后顺序,都可以根据实际业务调整。 数据过滤 对社区中所有作品按热度排序规则进行排序计算,且要排除已进入热门池的作品; 取出排名前 x 名的作品,放入热门池的子列表中; 子列表再放入父列表中,按照子列表的创建时间倒序排列; 如果当前计算中发现无可用作品,则本次计算直接跳过,等待下一次计算; 如果整个平台的可用作品数量 < x,则有多少就展示多少内容。 刷新机制 方式1:每 x 小时执行一次规则; 方式2:监控新作品增量,当增量达到 n 时,执行一次规则。 该方案在目前的移动互联网中,实际应用的场景已不多,但在少数web端的产品中如:虎嗅、36氪的信息流中,还能看到影子。 在目前的信息流展示策略中,最受认可的实属头条系的兴趣推荐算法,但对于普通企业来讲建设成本极高,有兴趣的朋友可以自行了解一下。 以上,抛砖引玉,欢迎指教,期待更多交流与学习。