笔者进行了为期四个月的《一起来捉妖》的数据收集,在此分享了从选择对象到收集数据,再到分析数据的经历,对于进行数据分析的同学来说,是个不错的参考。 数据分析:始于数据,终于信息。 截止2019-9-7,自己收集《一起来捉妖》的相关数据已有四个月啦!且也完成了数据的收集、分析以及呈现的过程。计划将该部分信息及时传递给"想要修炼数据分析之术和深入浅出的思考"的你,协助你更快、更好地完成数据分析产品的入门和实战训练,以及提升你的数据分析之术和思考。 一、我为何选择《一起来捉妖》呢? 1.1 Why 选择? 2018年,当时我正在研究区块链是什么?恰巧听到腾讯将发布一款基于区块链技术的游戏——《一起来捉妖》。由于该游戏的开发位于成都,我并不能拿到第一手的内测权限。故此只能等该产品公测时才能体验这款带有区块链技术的游戏产品。 截止2019年4月15号左右,调研发现很多小伙伴的手机里安装了一款游戏软件——《一起来捉妖》,我才得知它早已将区域公测拓展到全区公测的层面。我也从App Store下载了《一起来捉妖》,决定开启区块链游戏的历程。与此同时,我怀抱着对该款游戏的热爱决定收集《一起来捉妖》更新最频繁的活动模块入手,从大局上看产品制作者的角度看用户的想法。 1.2 普及《一起来捉妖》和《精灵宝可梦GO》的相关知识 很多人说:《一起来捉妖》是中国版的《精灵宝可梦》。故此我需要将这两款产品的相对共有的信息提炼出来,方便我们使用对比的方法观察二者之间的关系,如: 不可否认,两款产品有太多的相似之处。除了发布时间不一样以外,我认为《一起来捉妖》确实是一款贴近国内市场的角色扮演和奇幻冒险的游戏;且还是敢于在应用中尝试使用新技术——区块链技术,并完成落地。 同时,我通过百度搜索分别检索《一起来捉妖》和《精灵宝可梦Go》的关键词,然后发现精灵宝可梦Go的最新相关信息如下: 而一起来捉妖的最新相关信息如下: 我们从二者的最新相关信息可直观看出,《一起来捉妖》正在处于产品的打磨和产品推广的阶段;《精灵宝可梦Go》处于营收变现疯狂上升的阶段。不过我们从时间上来看:《精灵宝可梦Go》已经运营了三年之久,此时已经成为游戏运营者的摇钱树;而《一起来捉妖》刚运营满一年,游戏开发者正在急速打磨产品功能,远不知它的营收什么时候才能跟《精灵宝可梦Go》相提并论。 不过我愿意通过不断完善收集的数据,持续跟踪和记载它们运营中发生的里程碑事件,帮助大家推断《一起来捉妖》两年后的获得的答案是什么。 二、我如何收集《一起来捉妖》的数据? 在确定收集数据之前,我会按照以下三步进行原始数据的提取。如: 我将《一起来捉妖》的所有功能罗列出来; 我根据所有功能的更新速度统计出来; 我决定从《一起来捉妖》的活动板块入手来做原始数据的收集(注:活动版块的信息源始位置——官网的新闻资讯板块)。 2.1 制定收集的方向 由活动板块衍生出的方向主要有三个:产品官网、产品本身、百度指数。 产品官网—新闻资讯:承担起产品最新信息的生产和发布; 产品本身—终端产品:承担起产品最新信息的落实和相应的服务; 百度指数—数据监控:承担起监控产品被公众搜索的情况和市场画像等服务。 通过制定方向发现,大家可以发现:我遵循着产品信息的生产地——产品信息的落实地——监控产品信息的路径。 2.2 指定收集的时间 本次将收集数据的时间定为:每周周五的晚间十点。 为什么要指定收集时间呢?只有这样,我们才会保证收集的兴趣递增,不至于对数据收集产生嫉妒的厌恶感。倘若丢失收集的兴趣,数据的质量也将会大大降低,那么离我们分析数据的初衷也就会背道相驰。 怎么来指定收集的时间呢?主要依据时间维度和数据体量来选择相对合适的收集数据的节点。 分析原因:《一起来捉妖》官网的新闻资讯更新速度并不快,以一周为时间周期,以适中的维度为信息体量,将此作为收集数据的模式,最后为该模式限定一个具体的时间点去收集数据。 2.3 指定数据存档的位置 本次将收集的数据存储在:专属的Excel表格中。对于表格结构,我认为做到自己喜欢的风格,且便于寻找查询就可以。 我的表格中存储信息有:新闻资讯的时间和标题等信息记录,产品终端的新颖的功能或活动截图,百度指数数据统计数据统计截图。 三、我如何处理《一起来捉妖》的数据? 我认为处理数据的过程与收集数据的过程是不可分离的。 切记:在数据处理过程中,我们脑海中的数据是间歇性输出的过程,我们提前筹划给数据处理预留出足够的拓扑空间。在数据处理过程中,尽量按照自己理解的来处理。 3.1 为数据置入标签 在组建数据标题栏的时候,我们就应该时刻考虑,我们会从哪些方面处理收集的数据?单个层面下面应该包含多少子属性以及可扩展的属性等?我们不能控制住数据生产的源头,但是却有权利为它们置入我们所理解的标签,将它们变成我们想要的数据。 对于《一起来捉妖》新闻资讯模块的信息,从时间、信息标题、商业化&特殊时刻、产品标签、存在的问题以及日志更新时间(暂且未用)等标签入手,完成新闻资讯模块内的数据收集和数据分析。 对于《一起来捉妖》终端的应用落地的信息体验,从自身体验功能落地的情况,完成产品的实时数据收集和处理。 对于《一起来捉妖》的百度指数的信息,从趋势研究——需求图谱——人群画像的路径完成信息统计;从关键搜索数据、关键的需求图谱、搜索的区域分布以及搜索的关键话题为主,完成百度指数的数据收集和数据处理。 3.2 依据数据标签提取相应的数据 在数据处理过程中,我们需要时刻保持着敏锐的眼见。 为什么这么说呢?因为在处理数据的过程中,我们会不经意发现:不同标签下的数据存在间歇性的联系,故我们需要时刻保持着将关联信息的提炼出来。我经常会看到以下几个层面的提取方式。如: 基于时间维度的数据环比和数据同比; 基于时间维度的不同数据之间的相互影响; 基于文字维度的出现频率和出现权重; 基于相同内容的不同热词变化。 四、我如何呈现&分析《一起来捉妖》的数据 4.1 确定数据呈现方式 确定数据呈现方式,我们就需要考虑的是:数据与数据之间的关联关系;数据与时间维度的关联关系;数据和其他信息的关联关系。 如:我根据每个月发布的新闻资讯的数量,构建二维数据图表;我根据为新闻资讯的信息置入的专属标签,再利用词云技术统计出的热词频次对比和热词权重的对比;我根据新闻资讯数量和百度搜索次数,构建二位数据图表等等。 分析如下:相同时间维度的不同数据放的呈现问题;相同层面的不同标签的比重呈现问题;不同时间维度的相同内容排序问题。 注:每个场景下都有自己的建模方式,根据你的需求建立相对合适的分析维度即可。 4.2 利用已有的数据工具 日常生活中,我们肯定会遇到几个好的数据分析工具。你可以不精通这些工具的使用方法,但是你绝对不可以不留意。因为在你做数据分析的过程中,必定会用到它。本次我处理数据的工具有以下四个工具:python-图表展示;echart-图表展示;在线词频分析-词云;Excel-数据处理。 4.3 数据呈现及数据分析 1)新闻资讯的数据,依据相同的数据不同时间维度产出的图表。 结合图表曲线走势可看出,如下: 2018年期间,每个月的新闻资讯更新平均值为3.89个;2019年,每个月的新闻资讯更新速度平均值为17.63个; 截止目前,2018年的新闻资讯发布数量趋势和2019年的新闻资讯发布数量趋势大致相同。 综合来看,《一起来捉妖》正在蓬勃发展,产品制作方正在加快产品内容生产速率来满足更多用户的需求。 2)官网新闻资讯&百度搜索指数(整体指数/移动指数)对比,即相同时间维度的不同数据生产者的影响情况。 结合图表曲线走势可看出,如下: 在2018年4月-2019年7月期间,百度搜索的整体指数与移动指数的关系是成正向影响的关系。 在2018年4月-2019年7月期间,官网的新闻资讯发布数量与百度搜索情况,有正向的影响关系和逆向的关系。 综合来看,百度搜索的整体指数是由移动端的搜索指数支撑起来的,归根结底由产品运作的操作系统所造成的;而《一起来捉妖》的官方团队的信息发布速度在不断加快的过程中,而百度搜索的指数为何在不断下降。我发现后期的新闻资讯更新主要往游戏联营方向转变,跟产品自身功能优化并无大的关系,造成用户搜索的下降。 3)提取新闻资讯的全部文字信息源,利用词云共计统计出现频次最多的词语。 结合词云统计出的词频图来看 , 呈现自定标签:产品(89)、测试(16)类; 呈现产品核心标签:捉妖(41)、团战(5); 呈现产品治理标签:公示(14)、外挂(5); 呈现产品运营模式标签:直播(14)、联动(2)等信息。 综合来看:《一起来捉妖》在快速打磨产品&不断维护社区安全,大力向市场投放相应的食料,大肆补钓用户。 4)提取新闻资讯的全部文字信息源,利用词云工具分析热词的权重占比。 结合词云统计出的权重图来看,如下: 主要呈现产品、直播、游戏、捉妖等信息; 主要呈现公告、测试、商家、体验、停服更新; 主要呈现规则、较易、沙盘等内容。 综合看出:《一起来捉妖》就是在进行产品迭代,寻找最好的游戏策略以及结合最好的商业模式,快速实现游戏盈利。 5)《一齐来捉妖》&《精灵宝可梦Go》搜索指数对比 结合搜索统计的词表展示,《一起来捉妖》的搜索指数是《精灵宝可梦Go》的放大版搜索图。当游戏在进入市场,进行一波用户收割以后,经过自然沉淀就剩下了愿意为游戏耗费时间和精力的用户。此时游戏运作方应该考虑如何才能获得长期的利益产出。 6)《一起来捉妖》App Store的版本更新记录 结合版本更新记录图表可知,如下: ①系列和②系列更新间隔为:7个月 ②系列和③系列更新间隔为:1个月 ③系列和④系列更新间隔为:2个月 ④系列和⑤系列更新间隔为:40天。 综合发现:产品在初期推广的时候,选择特定的区域特定的用户进行公测,初衷在于维护产品稳定的运行服务用户;当产品决定铺展市场的时候,来选择快速迭代产品版本的目的是解决线上bug,同时满足线上用户的新玩法和场景。 故此,我通过对官网的新闻资讯数据收集,衍生到百度指数的数据统计分析,再到产品自身版本的迭代层面阐述着产品传递的信息。不过此时,我们不应该轻易处理该信息,正确的处理方式是:保持绝对的客观和理性深度的思考信息真实的意图后,再去行动也不迟。 实战的经历,只是想验证该方法切实可行,接下来才是真正的思考产出。 五、伴随着数据分析,我对《一起来捉妖》的思考 在我对《一起来捉妖》产生兴趣的时候,我总是伴随着思考总结一些内容。如: 玩家必须要操作的路径,开发者怎么来做的呢? 产品策略如何设计将玩家牢牢的吸引在游戏内容中? 产品所能赋能的地方有哪些? 接下来,我们带着上面三个问题来看,《一起来捉妖》教会了我什么? 1. 玩家的核心路径与开发者的开发路径 图文: 玩家进入游戏时,会依次完成以下操作"处理活动公告——处理身边的祈愿鼓——捕捉身边的妖灵——选择合适的处理妖灵方式——考虑何时再次上线捉妖"。思考一下,游戏的开发者需要怎么做才能依次完成玩家的核心路径呢?没错,他们也需要依次完成"发布审核通过的活动内容——开通申请鼓点的权限——调配刷新宠物的机制——配置处理妖灵的途径——配置游戏刷新规则,保证玩家再次上线"。 思考:我们借助玩家的操作路径,逆向推导游戏的策划者如何布局核心路径?他们需要怎么做才能保证产品在主流程留住玩家;且产品需要持续的服务玩家,玩家也需要持续的为产品创造财富。 知识沉淀1:通过玩家逆向推到开发者的设计方式,即换位思考。这种思考能帮助我们在制作自己的产品时候需要考虑清楚如何设计核心路径,如何制定产品迭代标准等。 2. 如何将线上的玩家时间延长加倍 图文: 闭环一:捕捉妖灵,在真实环境中且包中有足够的妖灵球,捕捉将会有以下几种奖励标准;捕捉妖灵,在真实环境中且灵力池中有足够的灵力的情况下,玩家可以开启游行模式捕捉妖灵。 闭环二:妖灵包中,妖灵可以用来培养、交易、分享以及放归等操作。若妖灵被培养升级了,则支持分享和放归,不能被用来交易;若妖灵被用来售卖,则需要去申请售卖位置,才能将售卖的妖灵放在售卖池里,等待其他玩家来进行买卖。 思考:游戏方使用妖灵穿起了整个游戏框架;其次,妖灵也承担玩家留存闭环的关键枢纽;最后,妖灵被培养或者被买卖的介质。如:用户的妖灵升级争霸、妖灵擂台争夺、妖灵跟随以及妖灵的买卖等。这样一来,我们发现:妖灵既是搭建框架的关键物质,又是构建游戏社区的关键物质。 知识沉底2:每个产品都应该有一个能穿起整个框架的物质或者介质,这样就能通过某种物质或介质完成用户的留存转化以及变现等操作,我们也可以设置不同的关卡来验证用户的路径,进而完善产品设计。 3. 产品未来的发力点在何处? 图文: 《一起来捉妖》的内置地图工具为腾讯地图,《一起来捉妖》可以帮助腾讯地图完善地图确实部分,也可以帮助腾讯地图完成玩家路径收集;《一起来捉妖》是带有地图探索属性的游戏,那么就应该具备地图的LBS广告服务的特性,而广告放置位置有:地图的鼓、敲击的鼓面以及捉妖的界面等。 《一起来捉妖》的盈利模式也可以有很多,如:广告商要求定制专属的妖灵、广告商要求制定专属的鼓、广告商要求定制专门的收货架以及商家(房地产)的选址等问题。 《一起来捉妖》是以"运动+游戏"的模式展开运转的,从游戏的角度,普及妖灵的知识;从运动角度,贯穿全面运动的理念;从安全角度,研发安全操作系统,降低用户因游戏造成的重大事故的发生率。 思考:分析一款产品时,我们也需要从它如何去盈利的层面去入手;从它如何站在社会的角度去运营入手;从它能帮助联营方做到什么去入手以及从游戏和健康的层面去入手等。 知识沉淀3:我们不仅仅要从产品内部完成用户的留存转化,还有从外部环境中去友好推广产品纳入更多的用户;我们思考如何对接商业模式,让我们产品实现盈利或者是创造营收,毕竟营收才是活下去的终极心念;我们也需要考虑为我们提供服务的底层公司,我们可以帮助他们做些什么,以及我们最终能到达什么样的效果,实现共同进步;最后我们更应该注意玩家的身心健康和知识学习为目标,愉快玩耍且学习,这样才能创造大大的共赢体系。 分析的过程是自身思考的过程,也是搭建自我金字塔的过程。