快生活 - 生活常识大全

掌握这几条小贴士快速提升数据可视化能力


  本文主要关于可视化相关的介绍,比如数据可视化图表、可视化分析的步骤、可视化分析应用思路等。
  一. 好的数据可视化图表可以救命
  约翰·斯诺(John Snow)在1854年制作了伦敦霍乱地图,通过标记死亡地图,清晰的了解到霍乱的源头,总而挽救了无数的生命。
  (图片来源百度)
  南丁格尔玫瑰图通过简单数据对比,更明晰表达军队医院季节性死亡率,打动了军方高层,军事改良提案得到了支持,方案实施后,伤员的死亡率很快从42%降低到了2%
  (图片来源百度)
  说回到我们现实的生活,当前和平年代,可视化也是在不断帮助我们:比如每天我们要看的路况图,天气走势图等等,都能一目了然的把信息传递给我们,让我们能够更方便的做出决策。
  (图片来源百度)
  二. 可视化分析的步骤
  举一个例子简要说明一下:
  (1)当前问题
  我发现付费数据下降了,这时候我要用RCA分析法,一步步找出问题,思考分析数据需要什么数据(活跃ARPU下降,付费ARPU下降?付费渗透下降?付费用户下降等等);
  (2)数据收集
  我们数据主要来源于游戏日志,我们可以自己用SQL提取,或者是找数据同事帮助提取,提取之后原始数据,进行加工清洗,找出有用的数据;
  (3)可视化展现&数据分析
  为了让观看报表的人可以更明晰理解我们的思路,我们会把根因分析的过程用图示列出来选取合适的图表。
  比如:看走势用折线,看不同类别用条形图等等;美化图表,选择合适的颜色,字体,等等;进行报告的展现,协同相关人一起分析
  (4)解决问题
  根据结论,进行针对性的修改,同时进行数据埋点,下一次再进行数据观察和分析。
  最终实现,以数据驱动产品的过程,带动产品更好的发展。
  三. 可视化分析应用思路
  1. 可识别应用效果
  在上述章节,我们说到了美化图表这块,通过以下的视觉属性展示,我们能便捷的识别出目标
  2. 数据类型分类&应用效果分类
  在日常的数据分析中,我们会遇到以下3种分类的数据,不同的数据类型,可以用来强调和区分的效果,参考如下:
  (1)分类数据比如:付费用户,非付费用户。此类数据可以用:位置,颜色,形状进行区分。
  (2)次序数据比如:优秀,良好,差。此类数据可以用:位置,大小,颜色,颜色深度,形状进行区分。
  (3)量化数据付费额度:1-10元,10元-50元等等。
  此类数据可以用:位置,长度,大小,颜色,颜色深度,方向进行区分,在进行不同的数据对比时,我们需要思考如何更好用到上述的应用效果,进行更明晰的视觉展示:
  (图片来源百度)
  3. 可视化图表&图形选择
  我们常用的基本统计图包括:条形,饼图,折线
  其他统计图:
  堆积,面积(简单的数量比较和变化趋势)两个维度的散点分布树型关系
  延伸的散点图(简单的点,扩展成图形,分布在散点中),图形或者气泡
  堆积图,面积图(用百分比更明晰对比)复杂的多环饼图
  图表建议如下:
  (图片来源百度)
  实例:图形+效果,更好展现数据。
  通过多个柱状图,我们可以同时比较多类别数据比较关系。
  增加颜色,效果更直观增加堆叠条,便于更细分数据。
  如下图,是对比不同城市的产品销量,通过堆积图,我们进一步把一个城市的产品销量做了分类。我可以明显的看到,销售量最多的城市,各类物品的销售情况。
  当然,如果还想更明晰的看到KPI达成情况,我们还可以增加辅助线。
  特殊的有意思的图:
  桑基图:特定的流程图的展示,一般我们用漏斗图可以分析一个用户从点击页面,到购买中间,整体的一个环节,但是,中间的一些细节我们关注不到,这时候,就需要用到桑基图,来看一个整体的流程流动情况。
  四. 地图可视化
  地图可视化可以为我们做什么?只是看上去更炫酷么?
  地图便于我们更明晰的找出地区之间数据的差异。
  以下是我做的两个示例表:表示每个区域的销售额度,你更喜欢哪一张?
  (1)常见地图可视化展示类型
  路径地图:可以用来看台风的路径,如果是吃鸡游戏分析,我们可以用来分析流失用户的地图路径。
  蜘蛛地图:
  用来看出发地点和一个或多个目的地的相互作用,比如了解地铁运行图。
  符号地图:文章开头的伦敦霍乱图,能了解各个位置的死亡数据。
  场景地图:不基于现实生活中的地图,而是基于某个场景位置,比如,我们可以看到商场哪些店铺更热门,超市哪些货架最受关注。
  (2)游戏应用场景
  应用于moba类,mmorpg类:我们可以快速知道死亡聚集点,新手流失地点,地图停留时长。
  PUBG类游戏:我们可以更快速的知道,死亡聚集点,落点,胜利点,新手流失地点等。
  (3)开发难点
  地图热力图的内容分为两部分,一个是基于数据计算的热力图,一个是底层地图,然后将两个图层合并成一个才能形成地图热力图。
  热力图绘制过程涉及到数据清理、处理、导入绘制,因为不同业务地图尺寸不一致,需要制定一套规则将数据转变的比例确定下来以保证代码通用性,和对原始地图的适配,需要考虑统一数据处理方案;网上热力图组件比较多,但是差异性较大,需要选择合适的数据向图形转换组件,这边我们也是在持续不断探索中。
  关于可视化相关的介绍,暂时说到这里,文章很浅显,希望能抛砖引玉,得到更多人的建议和意见。
  小彩蛋:我经常看的一些资源:花瓣网优品PPT设计素材搜索阿里巴巴矢量图标库
  本文参考了tableau数据可视化的科学与艺术,部分图例来自与百度,如有侵权,请联系我删除。
网站目录投稿:恨玉