随着人工智能概念的不断火热,笔者也于2017年开始投入到人工智能行业,并做了一个刷脸支付蜻蜓的项目。本文中,笔者主要以产品经理的视角展开对项目的总结与思考。 思考了很久,想理一理刷脸支付产品的整个解决方案,但毕竟目前还是技术驱动,涉及比较多敏感信息。无法来描述,那么我还是换个方式来说说这件事。文章主要思路还是一个产品经理视角通过现有公开信息堆叠出来。 讲到这份工作,就不得不提到2016年3月,AlphaGo 击败李世乭。2017年5月AlphaGo在中国乌镇围棋峰会击败柯洁。 我对这一切充满了好奇,我从16年的时候就各种了解人工智能相关的书籍,最深刻的有《必然》《失控》《漫谈人工智能》《人类简史》 。 我知道,一个新时代来了,于是我毅然从2017年初投入了人工智能大潮之中…… 在一个做3D传感器的公司里做刷脸支付蜻蜓这件事,是一个巨大的挑战。当然,作为产品人,我一直在告诉自己,也告诉团队"我们我们正在做一个改变10几亿人生活习惯的产品"。(哈哈哈,梦想总是要有的。而且已经实现了一半) 目录 一、调研(市场与计算机视觉技术分析) 二、需求(场景与需求) 三、产品定位 四、产品需求分解 五、产品架构 六、产品技术方案 七、测试 八、发布 九、数据分析 十、项目管理 一、调研 1. 市场分析 宏观层面 随着技术"算法"的迭代与突破,催生物联网技术,大数据、人工智能等迅速发展。再加上政府政策大力支持,例如政府工作中不断提及人工智能: 2015年5月《中国制造2025》 2015年7月《互联网+》 2016年《"十三五"国家科技创新规划》 2017年3月十二届全国人大五次会议工作报告中"人工智能"写入政府工作报告 2018年1月《人工智能标准化白皮书》 微观层面 数据显示:随着居民可支配收入的提高,我国消费者的消费需求快速升级,愿意为更高端、更优质的产品和服务进行付费,与此相对应的是对支付全流程的体验提出了更高的要求。 2008-2018年,中国线下商户的电子化支付的环境持续优化,银行卡跨行支付系统联网商户以及联网POS机具的数量连年增长,国民基本已完成电子化支付的普及教育。 随着监管机构在2016年以来重点整治收单行业,加上二维码支付的冲击,支付终端数量增速放缓;但以拉卡拉等率先推出的智能POS为代表的新型收单终端正迎来新一轮升级,或许将进一步挤压传统的POS机支付,为用户带来更优的支付体验。 做人脸这件事,就不得不来说说计算机视觉了,所以我单独把计算机视觉部分来写一个小篇幅,大部分是一些公开信息,也有一些是自己的总结。仅供参考阅读。 2. 计算机视觉技术分析 第三次人工智能热潮,是深度学习相关技术崛起而带动的结果。得益于海量数据处理计算能力的成熟,2006年深度学习(深度神经网络)基本理论框架得到了验证,从而使得人工智能开启了新一轮的繁荣。算法、数据和芯片算力是促进人工智能高速发展的三大核心要素。 来点实列: 2017年高交会上,人工智能的主题就充斥着整个会场。2017年9月支付宝已经在KFC落地刷脸支付试点了。 我当时自己统计了一些在会场比较高频,热度比较高的词。 这个时候我已经加入了奥比中光,所以我比较关心计算机视觉。 这些计算机视觉公司名气已经起来了(或者说我也是这个时候逐步熟悉他们的)。 2017年,这一年,2B端计算视觉落地最多的是安防领域。 这个时候,我们知道不同维度的计算机视觉应用了。 可以看到:AI人工智能技术的快速发展,给各个行业的产品带来全新的智能升级机会。 下面讲一个最典型的人脸识别设备。这个设备也是一个垂类市场,就做了一个确认你是你的事情。但是这个产品却是得到了爆发式增长。这也算是非安防行业落地比较实在的一个产品。 垂直市场:配合时刷脸(人证一体机) 如果我没有记错的话,主动配合式刷脸这件事,2016~2017年市场上就已经有了人证一体机、门禁考勤。 我没有去捞具体的数据。但是到今天,各个地方酒店基本上都上了人证比对这个设备,是公安系统推的,由于刷脸优势明显,所以是一个持续增长的趋势。他主要是1:1的对比,主要是用身份证ID、人脸与现场实时采集人脸做比对。 为什么要说一说这个产品呢,因为【刷脸支付】的产品跟这个设备属性是有类似共性的。 几个相同的点: 需要摄像头采集 需要一个硬件设备来显示,运算,交互 这是一个主动交互设备(人操作,设备反馈) 所谓的刷脸支付,也就是改变了POS机的形态而已,也是支付媒介的变化。至20世纪90年代,互联网的诞生引发了支付模式的进一步变革。我们历经从银行卡、快捷支付、条码支付到二维码支付的演进过程。现在,我们正在做刷脸支付。 写了计算视觉与同类型产品,现在也说说客户与行业信息吧(个人简单见解输出)。 目标客户 要做刷脸支付这件事,目标客户就是商家、需要收钱的人、渠道商、银行、支付公司、ISV厂商……是运营是业务的润滑剂。 使用者与购买者关系 作为POS或者说收钱工具的新形态,这部分份关系就很好明确了。 使用者:万千消费者 购买者:需要收钱的人 竞争分析 玩家都有谁?谁掌握了核心技术?他们各自的侧重是哪些? 若从支付的角度来看这件事,大玩家只有3个 支付宝 微信 银联 从关键技术来看(算法) 1. 支付宝(蚂蚁佐罗,早期face ++ , 阿里入股商汤) 2. 微信(腾讯优图) 3. 银联(目前除了平安,其他商业银行的人脸识别算法,还是落后很多于支付宝、微信的。或者说有些银行根本没有,所以银联系基本是外部合作为主。典型代表:依图,云从,商汤,face++) 做人脸这件事必须了解的算法指标 误识率(FAR: false Accept Rate):表示不同来源的人脸被接受的概率 拒识率(FRR: False Reject Rate ):表示来源相同的人脸被拒绝匹配的概率 其它常见参数指标: 可接入人像照片规模 实时对比规模 首选识别率/前N选识别率 错误报警率/正确报警率 人脸对比速度 特征模板大小(内存占用) 从硬件3D摄像头技术来看 支付宝(2亿美金投资奥比中光) 微信(数千万投资华捷) 银联(早期刷脸取款是用IR+RGB双目,其他技术也在进行中) 支付宝与微信与银联有一个共同目标,那就是获取用户留存用户。但由于公司本身属性不同,他们侧重点都是不一样的。 1. 支付宝:一家互联网金融公司。重视IOT,把生态合作提到了战略层。 2. 微信:重视用户体验。但对生物识别技术,以及整体解决方案并不是战略上的重视。(或许后期他们看支付宝铺好了路,再上??) 3. 银联:银联是有极其特殊的地位,但缺乏创新,缺乏对用户的理解。但无论谁都没有办法绕开它。算是强向心力的。 POS 行业的现状: 我们也从传统POS到智能POS研究了个通透,其实从传统POS到智能POS在硬件上是有很明显的变化的。下面是艾瑞 / 易观2017年的数据。 更重要的是,历史数据告诉我们,现有存量市场巨大,所以所有人都成了合作伙伴,也造就了蜻蜓。 盈利分析,如何商业化? 商业化不一定是要赚钱为目的,如何让用户拥有更好的体验,如何提升产品的活跃,这本身就是极具商业价值的。 当然我们有自己的商业化需求。略…… 二、需求(场景与需求) 需求是哪里来的?应用场景是什么? 撸需求这件事是产品的基本功,从互联网到智能硬件,一直都没有变过。 需求+场景——刷脸+支付 支付的场景还是极其复杂的,咋们初步锁定快消,快消行业是指消费频率高、使用时限短、拥有广泛的消费群体、对于消费的便利性要求很高的商品销售行业。 场景下的几个关键要素 安全 效率 流量 哪些技术是与目标用户相关的? 人脸识别技术(算法) 用户关心安全。 整体硬件方案(硬件+算法+云)用户关心体验。 成本与效率维度分析(渠道商与客户关心成本,关心付出与收益比)。 从用户层面讲,用户会想到哪些? Q:我拿着马云的照片是不是可以刷马爸爸的支付宝呢? A : 马爸爸没那么大方 Q : 我的人脸被摄像头采集了,是不是我的人脸信息就泄露了? A :不会 Q : 化妆可以识别吗? A :可以 Q : 戴墨镜戴帽子可以识别么? A :脸露出来就可以 Q : 唰的一下,钱就没了,这安全吗? A :确认机制,安全 Q : 买个3D模型可以识别伪装吗? A :识别为非活体 Q : 双胞胎怎么办? A :what?XX技术 从技术层面来看 人脸识别技术有快速、简便、非侵扰和不需要人的被动配合的特点。 人脸识别与其他生物特征识别技术相比。人脸识别是最直观、最准确、最可靠的。 单一要素的准确率是不可靠的,真正大幅度提高安全等级的,是由多个要素组成的系统。刷脸支付是一套完整的系统。听说很多时候的决策是由训练模型来决策的。 活体识别是一种技术,是一种算法。在刷脸支付的场景中,集合了多种活体检测的技术。所以用户不必担心。 这里借用百度开放平台的一句话解释:基于3D结构光成像原理,通过人脸表面反射光线构建深度图像,判断目标对象是否为活体,可强效防御图片、视频、屏幕、模具等攻击。 金融级人脸识别的技术要求和难点,我们总结以下几点: 高安全性:人脸活体检测技术(防止照片伪造、视频、面具以及专业软件工具等攻击) 高准确率:极低误识率下的高识别通过率。 高可用性:海量并发人脸比对服务 高实时性:人脸比对结果实时返回 哪些是商户相关的?(支付宝蜻蜓已经开放) 哪些新能力 会员能力 电子海报 简单操作即插即用 刷脸红包 是否更快 这里无非就是客户与用户的关系。 客户,在POS的行业链条来看偏传统行业,传统行业的产品业务非常复杂也有很高的壁垒。但是商业模式却很简单。无论多复杂的渠道关系,利益关系及产业链关系,最后只认一个结果,那就是把产品卖出去。 而用户却不一样,他不一定是购买者,但要使用你的产品或服务,用户与企业之间有联系,有交互。用户是张王牌,打好这张牌,我们必须重视用户体验。 (借用一句话,任何在用户体验上所做的努力,目的都是为了提高效率。这基本上是以两种主要形式体现出来的;"帮助人们工作的更快"和"减少他们犯错的几率"。) 需求: 需求来自用户、来自客户、来自商户、来自销售、来自趋势、来自老板、来自股东,作为老司机的你可以根据经验进行补全。 大的思路不变,我们最初也是根据市场,行业,趋势,技术,甲方爸爸来收集,结合对行业、竞品、场景和技术的了解开始了产品的规划。 最重要的是与客户的反复沟通,其实有时候客户可能也不知道他要什么?你理解的用户,不一定是客户理解的用户。 在这点上,我们是缺乏优势的——没有用研数据、也没有数据回流、也没有做过这样的产品。那么就需要更多的沟通与调研,而且这个工作还必须由产品来做,因为产品是连接内部和外部的工具。我尽可能的去理解客户所描述的用户需求。 客户基础需求如下 1. 快… 2. 满足XXXXXX… 3. 满足XXXXXX… …… 11. 产品功能需求略… 12. 产品技术需求略… (笔者没办法描述客户产品需求,但笔者认为:最重要的是如何去理解客户的产品需求,如何有效的权重,分析出哪些是核心,哪些是满足的惊喜,哪些是伪需求。) 收集的需求后,更重要的是把客户需求转化成技术指标与取舍工作。 我们一般根据用户/场景,走出去聊聊,走出去看看,经验假想往往是危险的,另一个就是产业链与技术标准,这点除了自己下苦工,还要内部聊聊,外部聊聊。 好在我们公司最不缺的就是Doctor级别的专家(与专家沟通技巧是不是也可以写一个篇幅,哈哈哈)。 三、产品定位 产品的核心定位 从初步需求来看,刷脸支付的场景是垂类,所有的一切都围绕着【支付】聚焦。如何更友好,更自然的利用3D结构光+人工智能(人脸识别)技术与用户交互,是刷脸支付产品智能化的关键。也包含人脸识别算法对图像和视频等数据进行处理的需求。 产品的核心目标 XXXXXX… XXXXXX…量产化 产品的定位主要是确认了目标,限定了范围,明确了相关约束,这一点越清楚,越能够统一团队成员对产品的理解,可避免很多争执与疑惑。 当然定位是一件极其复杂的工作,这个话题太大,咱也不敢聊。 四、产品需求分解 用一个四核2.0的平板电脑加上一个能同时输出距离/三维信息与彩色信息的相机,构成一个智能硬件产品。 通过3Dsensing,采集数据二维与三维原始人脸数据来判断人脸与活体,同时采集的人脸信息,并通过平板电脑的运算通过网络把人脸特征信息传给云计算,通过云端的卷积神经网络的训练模型来确认正确的人,然后完成支付逻辑。 看起来,这个产品很简单,但结合实际的场景需求来看,要做到好它并成功的大规模量产是极其复杂的。 1. 这个所谓的"平板"不同于消费类电子,如,一个电子海报的需求,就意味着硬件层面需要客制化。四字的"即插即用",意味着需要市面上绝大部分的收银设备你需要能够匹配。(客户基础需求那段提到了如此多的需求,意味着这是一个定制化非常规的智能硬件产品) 2. 3D sensing,单从摄像头的成像需求来讲,可以分为两个层面: 第一层是深度信息质量 第二层是彩色信息质量 这意味着不同的环境对摄像头的要求是不一样的。 且这是一个非常关键的需求,因为成像就靠这个3D摄像头了。成像给到算法判断,成像是源头,源头有问题,刷脸这件事就有问题了。 所以我们会在人脸的预处理部分做比较深的工作,主要也是从基础图像算法到光学系统。 从目前的产业链来看,成像的需求是一个最为核心的需求,这也是我们的优势,在经过一年多对刷脸支付的理解,针对人脸部分的成像需求,我们算是行业的头排兵。 需求是一个个问题包,我们拿到问题包之后开始进行需求分类。 需求分类是一个非常重要的工作。 设计需求(ID设计,结构设计,散热设计,接口设计) 器件需求(硬件性能需求) 软件开发需求(固件需求,驱动需求,SDK需求) 工具需求(测试工具,特殊工具需求) 测试需求(成像测试,压力测试,刷脸测试) 可靠性需求 功能性需求 …… 其实每个人对需求分类的方式不同,但是只要能够达到你的目的即可。产品同学都知道产品需求分析时会有大量细节决策是需要多方多维沟通的,涉及用户、现有技术条件、实际场景满足等极其复杂过程。 在实验室实现刷脸支付是相对简单的。没有大规模的并行计算,没有复杂的场景与环境,没有你意想不到的场景与环境。 而实验室之外的实际应用场景中,有! 在软件研发管理中,我们常常强调小步快跑,快速迭代。 实际上,软件是不怕产品粗糙的,不好用大不了不用呗;而硬件如果粗糙、难看、不好用,那么基本上就不买了,没办法掏购买者口袋里的钱、 另一部分是硬件到市场后,是没有机会再修改的,你怎么做小步快跑?可以跑,但是一般跑一次得6个月咯。这个做硬件的同学都很清楚。 智能硬件产品的需求不同于单个软件产品,智能硬件产品更贴实际的应用场景,每个元器件都会被纳入到场景的要素中去,要知道每个器件是有技术条件限制的。往往在这个部分器件工程师或者电子工程师是无法融合到多场景的。一般都是可用性测试后才知道要什么样的器件,这意味着你已经付出了足够的代价。 "跟着需求找物料,找方案,关注采购成本、生产成本、库存成本、时间成本对应的就是供应链管理、作业指导、生产管理、项目管理…… 硬件的坑比软件成本要高得多,因为拿到需求后,从ID设计开始出发,到产品真正MP,这是一张张毛爹爹铺出来的—— 10块的主IC能不能降到8块;显示屏从10寸改到8寸就要开个模;SD卡因为结构设计或是线材成本需要内置,能不动就不动;喇叭声音小了,3W换5W 成本增加了;喇叭孔开小了,再开;T0出来了,PO还没见,物料也不敢备,这一折腾,半个月不见了,包装盒子印错了,随便就万儿八千的不见了……." 这里我推荐老周的《智能主义》第79页专门写了《智能硬件的游戏规则》推荐互联网产品同学看看。非常有价值。 五、产品的架构 产品整体系统架构(仅整机) 作为一个在智能机器人行业混过的人,对一个整体解决方案并不陌生,不过单个摄像头就有复杂的光学与算法系统,再配合ASIC 芯片来完成。我把它统称为"成像" ,我们从四个核心模块来架构。 成像(特指摄像头输出的图片或视频流) 计算能力(指Android平台的主控计算能力与云端的计算) 人脸识别算法 支付通道(指支付宝) 其实架构这件事还是挺难的… 都是多维的思考与各方讨论之后分析出来的,略… 六、产品技术方案 当然产品的技术方案来源于产品需求,内外部复杂的沟通与协调这也是产品同学需要安排好的。基本上就是各种会议,我多次被技术的老板说请你先去了解技术规范,再来聊。 技术方案相对比是较复杂,刷脸支付的产品我们大概以下几个方案。这里要注意的是,技术的关系是层层递进,是相互交叉,这意味着产品的同学你需要对这些技术的边界有所了解,否则的话你会被骗的,也会被怼。如何把整个产品的技术架构理清楚了,需要努力,也需要了解"人"。 七、测试 测试是产品需求的验收,就是以产品定义来作为测试的卡控标准,并输出结论。基本上就是一个提BUG,验BUG ,开发解BUG,提BUG,验BUG ,开发解BUG的过程。当然也包含了一些研发的验证性测试。测试中除了专业的设备还需要与天斗,我们曾为了特殊的测试条件多次跑到其他城市。 产品用例测试 可用性测试 可靠性测试 用户体验 用户体验测试基本上是招募或者内部其他成员来进行测试,多是使用人员反馈与产品经理观察为主(基本上这一块会由客户验收时来做深度的反馈)。 其实在这个体验为王的时代,产品和服务是基础。支付宝有一个行业产品线,这条线上的很多工作很多时候看上去并不是单纯的"互联网化"。因为多数时候他们是在摸索如何改善社会服务的效率和体验。 八、发布准备 客户/用户教育 虽然说现在的产品很多都不做产品说明书了,但是不管是视频教学还是建议的安装操作步骤这些文案性的输出物还是产品来主导。千万不要用你的认知去套在用户认知上。 销售团队培训 销售的同学有时候并不知道你的产品优劣势,尤其是技术推动的产品,这就需要销售人员具备一定的技术解说能力了,一般产品同学会尽可能的把技术转化为可简易理解的白话来输出给销售同学。 产品推广方案——略 产品运营策略——略 产品定价——略 九、数据分析 客户/用户反馈 客户的反馈往往非常及时,一般反馈分为两种问题。第一是技术性的问题,第二种是使用性问题。 功能改进 由于不管是客户反馈还是用户反馈,我们收集到的信息数据都是滞后或者是需要累积收集的。往往产品的生命周期就拉的比较长。 技术迭代(略…) 数据分析(略…) 运营策略调整(略…) 数据挖掘(略…) 十、项目管理 开发进度管理 技术方案确认后就进入一个开发过程。为什么把项目管理单独放在最后是有原因的。因为这里是落地的关键。 原则上所有的项目都是有预立项的,这个过程主要是验证技术方案的可行性。在验证技术方案可行性通过后,会再次成立项目组,更多的是工程化的东西了。 研发过程需求管理 过程中需求的变化来自各个层面,一般有客户需求变更、技术限制、生产限制等。(需求变更管理我就不细写了) 团队协作 没有正式立项的项目与产品都是跑不下去的。 没有优先级的任务是会拖累团队的。 没有请开发吃饭你的需求是无法满足的开个玩笑,可以肯定的是一个靠谱的需求,一定是开发喜欢的。 一个解释: 读者可能会感觉我写的有点头重角轻,这仅仅是开始。一个项目的落地,要用文字来描述,完全可以成一本小说了。本文只不过从产品视角利用公开信息码出来。 一个感想: 做To B 再To C 的产品曾经几度怀疑人生,感觉3D摄像头嫁给了一个高富帅,但他们在相处的过程中总有那么多磕磕碰碰。时不时的还要娘家人……