笔者对一个腾讯产品面试题进行拆解,阐释了拿到题目之后的思考方向,分享给大家~~ 腾讯视频面试题目:现在需要为长视频设计一个评分功能,如何保证长视频评分的客观性? 一、什么样的视频需要考虑设计评分功能? (1)按视频类型将视频分为pgc和ugc ugc为原创视频:代表有油管,抖音,快手,b站视频板块等平台上的投稿作品; pgc为专业视频:平台自有资源,代表有爱优腾,b站动漫纪录片等板块,网飞等综艺,剧集,动漫和电影等。 (2)ugc没必要设计评分功能,原因如下: 1)平台角度:此类平台展示策略已经非常成熟,如b站视频根据投稿作品得到的三连数来展示,油管基于用户隐式反馈(观看行为)和视频内容来推荐,抖音快手只需要根据播放完整率,喜欢,转发和评论这些数据再配合用户画像即可进行精准推荐,增加评分功能只是徒增成本,且有反作用; 2)用户角度:1中已经谈到现有各大ugc推荐体系已完全满足其需求。无需再通过评分功能来帮助其进行筛选,且增加评分功能会破坏其刷视频的心流体验。如抖音快手,原本只需要下滑点赞转发等操作,现在还需要停下来去思考该给几分评分,有违初衷。 3)创作者角度:对目前的推荐系统玩法熟练,当下创作者激励制度也已足够,增加评分功能对他们来说意味着需要更新玩法,学习成本和适应成本增加。 综上,对ugc而言,设计评分功能是三输局面,从市场角度看目前也没有哪家上线评分功能。 (3)pgc有必要设计评分功能,原因如下: pgc的创作者多为平台自身或平台购买版权,平台对其自身产品自然有对应营销和展示策略。基于此情况,用户需要评分功能来帮助其筛选优质内容,且评分是离不开评论功能,评分功能同时满足大量评分爱好者。 b站动漫纪录片等板块最近上线点评功能,评分+评论(分短评和长评)模式,网飞则是传统评分导向平台。 再看爱优腾,电影动漫等板块,三家都有正常评分功能,而综艺和剧集方面,优酷和爱奇艺为其内容显示热度,用户只可点赞和评论,腾讯视频则没有热度,取而代之的是官方评分,这样的评分功能等于没有。 综上,一系列分析设计评分功能也只能给爱优腾设计一下评分功能。 二、视频评分功能设计分析 视频评分功能只是一个参考系,一个视频的价值不会因为较低的评分而被抹灭,单纯靠打高分也无法帮助视频实现真正的成长,对于长视频评分功能的设计,笔者认为从来不是"对与不对"的问题,而是这个评价标准到底"好不好"。 笔者认为视频评分功能参考体系来源于视频本身的质量和观众的个人喜好,对于个人情怀,文化差异甚至粉丝效应等因素会使得每个人的评价变得更为主观,有倾向性,使得视频评分的权威性会受到质疑。 因此,个人对长视频的评价是否具有参考价值,我认为取决于它能否尽可能多地摒除"个人因素"影响,表现出相对的客观性。 三、豆瓣和猫眼评分的对比 (1)豆瓣评分机制 豆瓣用户的打分是首先将一到五星换算为一分到十分,求和加起来再除以用户数。这个分数完全来自程序的计算,中间没有编辑审核,每过几分钟,程序会自动重跑一遍,以便把最新的分数加进来。 豆瓣的电影评分是参与评分人群的意见"平均值",尽管建立了相关的规避机制(基于"所有能判断属于非正常评分的一概不算"原则,豆瓣的程序会"判断"出那些"非正常分数",将其剔除在评分之外。),但总体上受评分人个人喜好的影响较大。 (2)猫眼的评分机制 它的电影评分由两部分组成:观众评分和专业评分。 观众评分:与豆瓣类似,由观众评价电影的星级再换算成相应的分数; 专业评分:由主流电影媒体的资深媒体人、资深影评人、影视专业学者等人组成,这些评审针对影片进行实名制打分和评价,最终分数并列显示在观众评分旁边。原则上,平台尊重每一位评审的独立性,不会干涉其打分。 他们对普通评分者进行了区分:购票观看的评分者会在用户名后添加一个"购"字加以区别,这在一定程度上能够减少水军刷分的影响。 专家数量和专家的专业程度都受到不同程度的质疑,再资深的电影专家,终究逃不开个人价值取向对评分的影响。 四、设计视频的评分功能 (1)首先明确这个需求从何而来,需求方是谁,需求是否合理,是否为用户痛点,是否有验证过这个痛点是否存在等。 (2)设计一个评分功能,这里涉及到三方(这里仅从正向表达利): 1)普通用户 "评分"功能可以给用户提供一个参考依据,来鉴别视频质量的好坏,再选择是否观看; 普通用户得到满足感,感觉受到重视,甚至跃跃欲试成为创作者。 2)创作者:优秀的内容激励创作者,持续创造更优质的内容。 3)平台 给平台带来更精准的运营策略制定,针对创作者不同属性,精细化运营; 平台可以根据用户给出的评分给予创作者不同程度的创作激励,并优化推荐内容。 (3)如何设计视频的评分功能 参考体系:内容质量和用户喜好,这里重点在于这个标准的好坏,如何设计权重比。 影响因素:质量得分,点赞得分,评论得分,转发得分,附加项得分 视频总得分=质量得分*权重1+互动得分*权重2+消费得分*权重3+附加项得分*权重4 ps:权重之和为100%,进行人为设定 质量得分:视频分享数,视频完整观看率等指标; 互动得分:视频评论数,视频点赞数,新增粉丝数等指标; 消费得分:视频总浏览; 附加项得分:暴击加分,热门加分,作弊减分等; 附加项加分为正向指标,如个别数值表现突出,超过预设值的N倍(这里需要人为单独思考设置),则给与额外加分,比如点赞数预设上限值为1000,当有作者得到4000以上的点赞时,考虑额外加分。 附加项减分为反向指标,当发现有作者作弊(水军出现)时,情节轻者扣分警告,恶劣者删除作者号,作弊可通过第三方软件和算法识别出来。 (4)功能的指标: 设计完评分功能后进行A/Btest,测试期间设置短期指标和长期指标,用来衡量这个功能是否要正式上线。 (5)A/Btest 清楚明确你要改变的是什么,提高的是什么,以及用什么指标来衡量,这里需要考虑短期新鲜感和对长期生态系统的影响。 五、扩散1:视频创作者的评分模型 设计创作者的评分模型可以刺激用户,持续提供高质量内容,针对作者不同属性,进行精细化运营。 模型是通过算法页的不同变量指标,对作者进行标准化打分,再根据各项指标不同的权重,汇总一个总得分,各项指标可以向下拆分一级、二级或更多级指标,各项一级指标、二级指标在0到100分范围内打分,无及格分数线。 作者总得分=质量得分*权重1+互动得分*权重2+消费得分*权重3+发布得分*权重4+附加项得分*权重5 ps:权重之和为100%,进行人为设定 质量得分:视频分享数,视频完整观看率等指标; 互动得分:视频评论数,视频点赞数,新增粉丝数等指标; 消费得分:视频总浏览; 发布得分:发布视频数; 附加项得分:暴击加分,热门加分,作弊减分等。 六、扩散2:现有的星级评分如何形成更好的差异化 (1)现状:5分数量太多,没有太多参考性 (2)打5分的原因: 人道主义,出于好心; 4和5分区别感不强,用户图方便; 从中心理。 (3)如何破局: 增加星级打分门槛 强化星级差异性 (4)设计思路 用用户时间思考替换用户的便捷: 点击打分更改为滑动打分,滑动过程中,给用户思考时间去衡量; 文案提示:例如1分为非常不满意,2分为比较不满意,以此类推