作者:古牧聊数据 本文在PMCAFF社区发布(www.pmcaff.com),转载请注明作者及出处。 开局一张图 如何才能设计出爆款数据产品?这个问题就好比"怎样才能画出世界名画一样",没有定法。但经常欣赏优秀的作品,尤其是在专业人士的指引下鉴赏名作,一定是各个阶段画家的必经之路。今天,古牧君就斗胆带大家一起鉴赏一款数据产品:百度指数 1,为什么选百度指数? 因为它是公开可见的,同时,它也是比较好的 数据产品有很多,但大部分要么是企业内部自用的,要么是卖给其他公司或组织的,可供广大普通用户体验、分析的数据产品很稀少 至于为什么说它是好的?因为百度指数本身已经成为了一个简单易懂的评价标准。比如数据分析师这个岗位到底热门不热门? 跟产品经理一比就知道:数据分析师还是个弟弟。百度指数就是背靠百度这棵大树,用网民搜索数据量化衡量大众对某个事物的需求量,操作简单易懂,经常被用来做行研分析 基于上述理由,我们就拿它来做"教学示范"了 2,怎么评价一款数据产品? 上面咱们只是说了百度指数比较好,但要具体的鉴赏,就需要构建一个评价体系。好比一幅世界名画,不能光说它有名,夸奖的人多,所以它好,这是一个循环论证。我们需要从线条、构图、色彩、意境、历史意义等多个角度去拆解一幅画,同样的,数据产品也需要有这么一个评价体系: 在这个评价体系里,产品的目标定位是高于一切的,产品的功能是服务于目标定位的,最后才是数据、策略和交互设计,这三者是服务于功能的。为什么把目标定位抬的那么高?很简单,把科学家、画家、公益志愿者、商人等人放在一起,统一用挣钱多少来衡量价值,是不是太偏颇了?数据产品也一样,上来就不分青红皂白直接谈交互设计、谈策略算法,太武断了。那么大家觉得百度指数的产品定位是什么呢?是官方介绍的这个么? 反正我不信 我们还必须认识到,每个爆款产品的诞生和发展,都有一定的偶然性。我们不是给名人立传,所以不用太过纠结百度指数的历史渊源,只要把目光聚焦在近年来这个产品的稳定形态就好 类似了解一个人,就必须知道他所处的环境,我们揣测百度指数的定位,就必须正视:百度长期以来是一家纯正的广告公司,百度指数近年来一直位于百度的商业化广告部门。基于这个事实,古牧君推测百度指数的目标定位是: 它是一个展示能力的窗口,告诉外界百度具备哪些数据能力,尤其是面向广告主秀肌肉。在线广告市场是需要不断教育引导的,很多行业的广告主并不清楚,在百度投放广告相比线下投放广告有什么优势?尤其是所谓的大数据到底能帮他们解决营销中的哪些问题?这些都需要一个具象化、可体验的数据产品来承担; 依托百度前几年在在线广告市场中的份额优势(尤其是在阿里、头条崛起之前),针对广告投放的效果好坏,制定出一个行业标准,尤其是在品牌广告这个细分领域。效果广告可以用ROI来衡量好坏,比如1w块钱带来了多少个转化;但品牌广告很难,它更多是瞄准消费者的心智,心智怎么衡量呢?消费者们看完一个高大上的汽车广告之后,对这款汽车的是否有显著提升?总不能每次广告之后都撒网去做调研问卷吧?一个美好的商业设想顺应而生:看百度指数,广告投放后指数高了就是效果好,高的越多效果越好~自己做裁判员,岂不美哉? 如果大家都承认了这个标准,那就可以进一步挥舞大棒,去刺激各个广告主花钱了。你看看,就是因为你广告投的少,你的百度指数比隔壁竞争对手低了一倍!说明消费者心目中你不行了,还不快花钱来百度投放广告?! 总结一下就是秀肌肉、定标准、促消费。那好,咱们继续按照这个目标定位,拆解评价分析一下百度指数 3,指指点点百度指数 按照目标定位、配套功能、配套数据/策略/交互这个评价体系,我们分别对秀肌肉、定标准、促销费这3个推测目标进行展开分析 (1)秀肌肉: 可以把广告营销粗略概括为:给需要的人、在适当的时机、讲正确的话。给一个有点儿饿的白领,在饭点儿的写字楼电梯间广告橱窗里,强调某家的饭菜美味实惠又精致,就是个不错的营销方式。不论是传统的广告创意公司,还是新兴的互联网广告巨头,都无法逃避广告主爸爸们对上述3个问题的诘问。只不过过去主要靠人的经验去猜测,现在可以靠数据去推演。如果百度指数能证明自己具备上述3个能力,哪怕只是小试牛刀、有所保留的展示一下,就算是很好的完成了秀肌肉的定位。咱们分别看下每块是否达标: 给需要的人,就要求能从数据上洞察出目标受众。潜在的逻辑就是支持广告主自己选出一群人,在百度的大背景下就是搜索过xxx的人了。进一步,这群人的固有属性画像和兴趣偏好画像,也是基础配置 从上面截图可以看到,该有的基本都有了,但细节还有很多打磨空间:比如地域分布中,是不是可以用一二三四线城市替代省份分布?兴趣分布中,是不是标签可以更make sense一些? 选择合适的时机,主要是投放的时间和渠道。这就需要一方面能把数据在时间粒度上有所区分,一方面在渠道上有所区分 从模块截图来看,时间上可以通过自定义满足天粒度的大范围时间选择,但缺乏实时性数据能力的体现;渠道上,百度指数仅仅是按照PC、移动进行拆分,没有体现出百度在不同类型流量上的区分,如知道、贴吧、图片、文库、地图等 这个模块最大的疑问,就是搜索指数下面多出了一个资讯模块,逻辑上颇为诡异。先看其中的资讯指数,从说明解释中可以看出,它来自网民对网页链接的阅读、点赞、转发等互动数据,逻辑上层级有些复杂。从搜索到阅读,这是一个层级;从阅读到点赞转发等,这又是一个层级,资讯指数把两个层级的指标揉合在一起,有些不妥。同时,百度并不是一个内容社区,从搜索到阅读还算是一个比较顺畅的操作,但你指望网民在点击搜索结果阅读后,还对网页进行点赞、评论、转发?这也不妥 再看那个媒体指数,它是被百度收录的搜索词相关的新闻数量,比如奔驰的媒体指数,就是标题中包含"奔驰"的新闻数量,这......?【野马奔驰在草原上】算不算?再者说,从概念上看,媒体指数描述的是媒体对一个事物的程度,是PGC,呼应的应该是搜索指数这种UGC。把媒体指数和资讯指数合并在资讯这个概念下,而不是让媒体指数跟搜索指数在一个概念层级,古牧君个人感觉有些不对劲儿,理应是搜索指数和媒体指数在一个概念层级,然后把浏览行为附加到搜索指数下面,作为一个补充 在秀肌肉里最后一部分就是讲述正确的故事。这部分比较复杂,本文不特别展开叙述,感兴趣的可以翻阅数据让广告说话这篇旧文。这里古牧君只着重讲一下百度指数中的需求图谱模块 它是百度指数产品功能架构中与趋势和人群画像平行的一个模块,可见其重要性。查看其模块解释,它的目标是探索网民搜索某个关键词的前后,分别搜索了什么。这相当于是研究网民的意图,从单个搜索关键词这种静态的切面,变成一个动态的链条 该功能想要秀的肌肉,是告诉广告主们:百度这边可以通过数据,分析网民的品牌决策过程。这点是相当关键的,因为购买决策是整个链条中的重中之重,过去我们永远无法得知他为什么最终选择了品牌A而不是B,但在百度上,或许我们可以通过他一连串的搜索行为管中窥豹,因为搜索就是意愿的某种外显 但很明显,这个模块还处于探索阶段,因为很多结果是难以解释的。比如下图中红框里的几个关键词,是怎么跟数据分析师扯上关系的?我怎么也想不出会有那么多网民先搜了上海夜宵or无锡财政网,然后又搜了数据分析师,最后又搜了胶带硫化机?这是一个什么脑回路?!古牧君感觉这里面一定是数据清洗过滤层面出了些问题 (2)定标准: 想要成为一个标准,就要做到客观、公正、可解释,当然还有一个大前提,就是百度在在线广告市场说得上话。在头条抖音、腾讯广告远未兴起的那几年,百度就是国内在线广告市场的代名词,好比社交通讯的一样。也正因如此,百度指数才能背靠大树好乘凉,要不然怎么没听说搜狗指数那么火呢? 而客观、公正、可解释,就要求百度指数要跟大家的直觉保持一致,且计算方法科学有效。这是一个小的策略问题,它要求设计者利用搜索等数据,经过一定的加工处理,使得最终输出的结果既能维持原有的波动变化趋势、又能维持原有的相对倍数关系,同时还不会被人反向推算出原始数值。稍微解释一下,就是你看到的"数据分析师"的搜索指数,不会直接就是一段时间内搜索这个关键词的次数,因为这涉及到百度的一部分商业隐私,需要加密输出;而且这个加密逻辑,也就是指数的计算方法, 还要能复原不同时间下该关键词搜索次数的高低趋势,不能说原始数据是周二高周三低,指数化之后变成周二比周三还低了?进一步,原本"产品经理"这个关键词搜索次数是"数据分析师"的2倍,指数化之后就还得是2倍,否则指数之间的对比就失去了意义 这个指数化的加工处理过程,也不应该只是简单的设计一个公式,还会涉及到大量的数据清洗过滤策略。比如我想看看苹果和华为哪个指数高,可细想想好像苹果这个词歧义挺多的,还包含了水果,百度指数能否保证最终输出的苹果的搜索指数里,没有掺杂"富士苹果"呢?尤其是针对搜索这种短文本做清洗过滤,难度还是相当大的,一定少不了人工规则整理 (3)促消费: 如果广告主承认了百度指数的权威性,那对百度来说这个生意就好做了,相当于既当运动员又当裁判员。这个时候就需要分行业编排这种品牌排行榜来刺激广告主了,让他们时常为了百度指数的高低而焦虑,忘记本身通过产品力去塑造良好的品牌形象等。这就好比天天拿收入作为衡量好坏的唯一标准,让大家沉迷于挣钱无法自拔。如下图,百度指数在这点也兼顾到了 4,总结经验以便自用 按照我们对百度指数目标定位的揣测,当前版本的百度指数该有的基本都有了,只是在一些细节上有些许迷思。比如搜索指数、资讯指数、媒体指数3者之间的关系,比如人群画像中对所属城市分布的执迷,比如需求图谱模块展示结果的难以解释,但这些都还算瑕不掩瑜。古牧君真正觉得需要好好讨论的,是作为数据产品,内部各个功能模块之间的逻辑关系: 古牧君一直认为,数据产品与数据工具最大的区别,就是功能模块能否串联成一个完整的故事线,这条故事线就是"业务数据化---