留存率这个概念对于大家来说一点也不陌生,平时看到的更多是固化的留存率,一般统计周期按天,常见有次日、7日、14日、15日、30日、60日等;如果大家想看更加灵活维度的留存率,比如按照某一日期时间段的留存率,都有经历这样的流程:给分析师提需求——分析师给技术提需求——分析师拿到数据并分析留存率——将数据结果给PM/运营,这个流程至少需要持续一天,一天后才能拿到最终的结果,不仅耽误了调整网站运营策略的最佳时间,还可能因为时间间隔存在数据误差的情况。这样的流程的确降低了工作效率,那有没有什么方法能更加自主、灵活地计算留存率呢? 1、何为留存率? 在互联网行业当中,因为拉新或推广的活动把用户引过来,用户开始访问网站/应用,但是经过一段时间可能就会有一部分客户逐渐流失了。留存率定义为用户在某段时间内开始使用网站/应用(一般定义是注册),经过一段时间后,仍然继续使用的人被认作是留存用户。留存率体现了网站/应用的质量和保留用户的能力。 留存率计算方法:留存率=登录用户数/新增用户数*100% (一般统计周期为天,常见的周期维度有次日、7日、14日/15日、30日、60日、90日) 比如: 次日留存率:(第一天新增用户数,第2天还登录的用户数)/第一天总注册用户数 7日留存率:(第一天新增用户数,第8天还登录的用户数)/第一天总注册用户数 30日留存率:(第一天新增用户数,第31天还登录的用户数)/第一天总注册用户 留存率≠ 活跃率 留存率和活跃率混为一谈,这是一个很严重的误区。大家经常会用日活(简称DAU)来监测网站/应用,有时候日活在一段时期内都是逐渐增加的,按理说这是一个好现象,但是如果忽略了留存率计算,这个结果很可能是一个错误。比如某公司做了很多拉新、推广的活动,带来了很多新用户,其日活数据应该也是增加的,但是最终留下来的用户不一定在增长,甚至有可能在减少,只不过是新用户太多而掩盖了留存率问题,实际上用户的留存是在逐渐降低的。 2、留存率在数据平台中是如何实现的? (1)如何设定 维度:日期维度 数值:新增注册用户+留存设置(注:留存率可同时计算多个,如次日留存、第7日留存、第30日留存、第1季度留存等;) (2)留存率设置 经过很多相关的数据调研,我们最终确定留存率可以按日、周、月、季度、年、或自定义时间段来计算,以往大部分留存率都是以日为维度,但这些按周、按月甚至自定义时间段的个性化需求是很强烈的,能帮助我们客户了解更加网站的具体留存数据,做出更加正确的网站运营策略。 按固定时间:最基础的设置,只查看未来某个固定时间的留存率 留存周期:选定按固定时间计算,包括:日、周、月、季、年,比如第n日,第n月,上图设置第7日; 日期字段:选择工作表里是日期的字段,比如用户访问时间; 所选日期:即留存周期的开始时间,默认固定时间,也支持自定义设置时间段; 数值设置:留存率、留存数,这个应该不难理解; 上图含义:今天之后的第7天留存,即7日留存; 按范围时间:设置更加灵活,可以查看未来某一段时间范围(按固定的周期,比如第1周-第7周)的留存率 留存周期:选定按范围时间计算留存率,包括:日、周、月、季度、年,比如第n日到第m日,第n月到第n月,上图设置第1日到第7日(即次日-7日留存); 日期字段:选择工作表里是日期的字段,比如用户访问时间; 所选日期:即留存周期的开始时间,默认固定时间,这里我们选择自定义设置时间段; 数值设置:留存率、留存数,这个应该不难理解; 上图含义:2016-07-21到2016-07-31这段期间的新用户总数对应的次日-7日留存情况; 按自定义时间段:最个性化的设置,可以任意查看未来某一段时间范围(无固定周期设置,任意设置日期范围)的留存率 (图1,所选日期:固定时间) (图2,所选日期:自定义时间段) 留存周期:选定按自定义时间段计算留存率,比如从2016-08-04到2016-08-31; 日期字段:选择工作表里是日期的字段,比如用户访问时间; 所选日期:即留存周期的开始时间,可以选择固定时间(今天),也可以自定义时间段; 数值设置:留存率、留存数,这个应该不难理解; 图1含义:今天的注册用户在2016-08-04到2016-08-31的留存情况; 图2含义:2016-07-21到2016-08-03的新用户总数在2016-08-04到2016-08-31的留存情况; 另外,需要注意一下高级选项中"在计算留存率的时候计算值可能存在多个状态"这句话是这样理解的:比如大部分网站使用用户ID来计算新用户、用户留存率,新用户只是对用户ID做了一个计算判断(比如,访问时间-创建时间=0,即此用户ID为新用户),留存率也是针对用户ID进行计算,那访问日期来的用户除了之前留下来的用户,还有访问当天来的新用户,这时候就必须把访问当天的新用户给排除,只剩之前留下来的用户才能算作留存用户,计算出来的留存率才是正确的。 若留存率计算对应的字段不存在这种例外情况,可以忽视这个所谓的"高级选项"。 以上就是留存率是如何在数据平台灵活设置的相关内容,下期想跟大家分享的是留存率的设计理念和一些实际应用的场景,以产品设计角度跟大家分享更多有关留存率的知识。