2016年网易产品实习中,有这么一道数据估算题: 估算今年全国通过网络参加考研培训的人数? 这类题型主要考察: 逻辑思维能力:遇到问题能否清晰有条理。 数据能力:对数据的关注度,是否重视日常的数据。 细节把握能力:是否注意分析中的细节,结合实际情况去细化 要点: 准确的数据越多,估算越有根据,也体现了应聘者对数据的重视。 漏斗模型,注意每个环节的人员流失率。环节考虑的越多,对问题的分析也更加透彻。 用户分类和画像。尽量结合用户的使用场景,对用户进行分类,这样数据也更贴合实际情况。 思路比结果重要。最终的数据可能不在一个级别,但是在有多种方案的情况下,通过不同方案的比较大致可以估算出一个量级。考察的重点是思维。 本题解答思路(供参考): 步骤1:做加法 (本阶段不求正确,多多益善) 寻找准确能够获得的数据,从不同维度来寻找数据,类似头脑风暴: 1.提取关键字法: 可以通过去掉其中的一些形容词,提取关键字来联想 全国+考研:今年全国考研人数 网络+培训:今年全国网络培训机构数,机构收入数,培训人数 2.从人、地点、时间、钱几个维度来寻找线索。 人:考研的人数,培训老师的人数 地点:高校数,机构数 钱:在线教育交易额,客单价。 3. 从提供端和需求端两个维度 提供端考虑:机构数,机构老师数。需求端:课程数,学生数。 步骤2:做减法 从步骤1提取自己较为熟悉的数据且和目标数据相关度更明显的数据。目标事件为考研培训,直接参与的主体是教师和学生,我们不妨通过教师数目和学生数目来突破。 步骤3:方案分析 本例提取考研学生报名数:170万,大学教师数150万 3.1 由培训教师来计算 考研科目的培训主要集中在外语,数学,政治等科目。 英语教师、数学教师、政治教师累计占比: 一本院校: 计130所,平均每个学校英语(含小语种)教师60名,数学教师(基础数学)按50人计,政治教师按40人计。每个老师平均按30个学生计,可以带学生,考虑到学生实际可能一个人报3门课,平均每人按报1.5门课计。平均每一百个老师有3个做培训。 得到:130x(60+50+40)x30x3%/1.5=1.17w 二本院校: 750所,平均每个学院英语老师(含小语种)教师35人,政治教师30名,数学教师计30人,每个老师平均按20个学生计(教师影响力认为比一类院校差),可以带学生,考虑到学生实际可能一个人报3门课,平均每人按报2门课计(认为二本院校学生培训需求相对较强)。平均每一百个老师有5个做培训(认为二本院校教师时间相对充裕)。 得到:750x(35+30+20)x20x5%/2=3.18w 方案2合计:1.17w+3.18w=4.35w 3.2 由考研学生来计算 按大学来分:一本院校研学生占总考研人数比50%,由于资源相对较多,集中在线下培训,其中参加线上考研培训的比例按1%计,二本院校考研人数占总考研人数比按40%计算,参加线上考研培训占考研人数的比例按3%计算,三本考研人数较少占总考研人数比计10%,参加线上培训的占考研人数比例计2%。 计算结果:170w x(0.5×0.01+0.40×0.03+0.10×0.02)=3.23w 步骤三 计算过程中的要点 要点1:漏斗模型: 每经过一个环节,数据都会打折,留存的百分比直接相乘得到结果。 方案1漏斗模型: 在顶端数据确定的情况下,漏斗本身实际存在的环节越多最终的误差越大,分析时选择的环节越多,数据越接近真实数据。最终的结果为漏斗底部数据乘以各个环节的留存百分比。 要点2:通过用户画像对用户进行细分。 根据学生考研院校的不同,分为一类本科和二类本科,根据教师所教的课程不同对教师进行分类。分类原因是因为这些不同的用户在不同的漏斗环节具有不同的流失率,有利于数据更加准确。本例在答题时间充裕以及对考研情况非常了解的情况下,学生可以继续细分为不同专业的学生,不同收入水平的学生,对于政治教师可以继续根据教师的方向分类,例如和考研相关的马克思主义理论教师从事培训的比例相对较高,可以和其他方向分开计算。甚至可以根据年龄进行细分,有经验的较年长的老师可能参加培训的比例更高等。 步骤四:交叉验证 本例中两种计算方案最终数据大致相当,得到了一定的验证。 总结 主要的思路和流程如上图:以上简要介绍了产品笔试面试中常遇到的估算题。最终的数据不一定可靠,但是思路是大致一样的。功夫在平时,我们只有多关注数据,平时有意识对用户进行细分,才能更好的锻炼思维。