人工智能的故事似乎已经停滞,但冰冻的地底还有细流在涌动。刨除异想天开的虚构故事,把握用户需求,结合优质的人力资源,人工智能最好的时代已经到来。 一、绝望的深谷 人们总是高估了近期(一两年)的变化,而低估了长远(十年)的变化。 从vr到人工智能,从区块链到5g,这些年新技术的发展"完美符合"了gartner(技术成熟)度曲线,短期被高估,长期被低估,一开始总是被寄予厚望、拼命炒作哄抬,创业者和投资人一拥而上、生怕错失;接着终于泡沫破裂,市场刹那冰封低迷、跌入绝望谷底,追捧者一哄而散。新技术本身正是在这无人关注的深谷中步入真正沉稳爬升的成熟期。 人工智能现在就在这样的爬升期。 曾几何时,阿尔法狗击败李世石,国家刚刚制定人工智能大战略,科技创业者们意气风发,想要成为各行各业"门口的野蛮人"。 但是短短两年,这个故事好像忽然就停滞了。 对于大多数的人工智能创业者来说,面对的问题其实是一种"不对称":懂技术的人不知道市场的需求和痛点,懂市场的人不知道到哪找技术,这是一种技需不对称。 技术型创业者往往陷入"炫技"的误区,他们念叨的常常是我有怎样了不起的技术,如果你问他"用户有什么需求,能帮用户解决什么迫在眉睫的问题",回答就变得语焉不详。这样的创业思路,诞生了很多"看上去很酷、但并没多实用"的产品; 手上拿着锤子,往往看谁都像钉子。为了人工智能而人工智能的创业者,搞出来的往往都是锦上添花的伪需求——这个事情用人工智能很酷,但是不用也没啥。 就算你抓住了真实的需求,选对了方向,可是成功也不会立刻到来,你的算法要成熟,需要数据和时间,需要等和熬。 很多创业者喜欢引用亨利福特的话:永远不要问客户他的需求,因为他们只会说我需要一匹更快的马(他们不知道有汽车)。 如果把人工智能比作汽车,那么很遗憾,当下的很多应用就像是一辆很笨重、很昂贵、常常出事故毛病的汽车,这种萌芽状态的汽车相对马没有体现出任何明显优势,那么用户凭什么买单? 数据要积累,算法要训练,算力要提升,整个系统要持续迭代……创业者根本不可能迎来忽如一夜春风来的高光时刻,迎接的只能是慢热、积累和等待。 但是资本等不起,尽管经历洗牌、市场上残留的好项目越来越多,但资金却不足了。 更何况,创业者要想在专业领域实现增长,面对的是专业的"深水区",一个巨大的阻力来自既得利益群体。 你想革同声传译的命,用人工智能实时翻译?放心吧,你首先会面对翻译们的同声抵制。你想取代金融会计人员,让各种交易结算智能实施?那你得看能不能过得了客户财务总监那一关? 如果被既得利益者挡住,人工智能就不能在专业领域真正落地,那么近一步的数据获取、深度学习、算法训练更是无从谈起。 技需不对称,成熟要久等,资本等不起,行业有阻力——这是横亘在ai创业者面前的四座大山。 马云曾经说:必须学会在没有鼓励、没有认可、没有理解、没有宽容、没有退路、只有压力的情况下,一起和团队获得胜利。今天的人工智能创业者可能正面临着这样的处境。 但这或许也是一件好事。 二、猪圈里的落地 2018年,一场罕见的非洲猪瘟席卷了全球,中国受灾尤其严重,短短一年内生猪死亡已经突破1亿。 在疫苗研发出来之前,能做的只有第一时间切断感染源、第一时间监测疫情变化。 猪瘟一旦发生,一个明显的迹象是:"二师兄"的呼吸和体温会迅速发生变化,呼气声音出现异常,动作和姿势更是逐步奇诡,步胎僵硬,关节肿胀。 症状是有了,可是谁能24小时盯着猪群不放呢?谁又能第一时间准确识别猪呼吸声的异常,也许人家二师兄只是不凑巧感个冒?更何况,就算养猪户已经发现了不对劲,为了避免损失,他拖延发布呢? 在河南洛阳,一个大胆的想法被提出来:如果使用人工智能呢,建立一套高速互联的智能监测系统,通过声音识别、图像识别、音像智能分析,第一时间发现猪群异常情况? 这条路一旦走通,用人工智能的摄像头和录音设备去监控,可是比养猪户自己看着要靠谱多了。 基于这个思路,一个ai智慧养殖基地在当地建立了起来,擅长解读声音的某知名科技公司语音云扮演了技术角色,6个月时间第一批30头猪已经出栏。 一直以来,人工智能都是一个"高大上"的概念,但是现在却落地在了养猪场里,就像是丁磊养猪一般有点"不务正业"的意味。但这,或许就是一个靠谱的开始。 三、去模拟"高手" 2019年,全国普通高校就业人数834万,相比2018年增加了13万。就业当前,第一道关口就是"面试",很多人想去大公司,但是要进这些公司往往竞争激烈、只有一次机会。 有没有办法,在面试某个"黄金岗位"之前,先模拟面试几次?对面坐着大公司hr一样的人物,对我的每个回答、每一个动作表情都给出意见?这样只要多模拟几次,心里就有谱了。 这样的事情在公务员考试领域早有先例,可是企业面试比公务员面试复杂太多。 一家上海的创业公司给出了另一种思路:如果坐在对面的面试官是"ai"呢,他可以学习和模拟大公司hr的偏好,对你的每一个声音、动作和表情进行捕捉,对你的回答内容进行分析,并且给出针对具体的建议呢? 他们做出了一个ai面试的小程序,学生们可以在上面进行基于高清视频对话的模拟面试,并且得到针对性建议。 换一个角度,如果这个ai真的可以精确模拟大企业面试官的心理偏好,那是不是可以在某些领域替代hr呢? 这样的事情同样可以放到教育领域,一个常识性的认知是:名师出高徒,名师要因材施教。但是这样一来问题就出现了。 对于整个教育大盘来说,名师资源是极其稀缺的,更多的经济落后区域难以获得名师的垂青。名师个人的时间和精力也是有限的,根本不可能对每个学生深度了解、个性化教授。 于是ai又登场了,一些大公司和创业公司瞄准了ai教育,通过人工智能系统对学生的学习水平进行"扫描",然而针对性的推送学习内容(名师生产),去模拟一个虚拟的可以因材施教、无处不在的名师。 再比如,最近这些年选美和选秀活动风起云涌,但是各种黑幕和潜规则横行,各种拉票和刷票爆发,活动的公正性一再遭受质疑。 可不可以做一个人工智能选美系统,深度学习人们多元的审美观,模拟普通大众对选手的真实反应?绕开了评委打分和大众投票,是不是潜规则和刷票就能消失?这是一家杭州互联网公司的思路,他们正在和亚洲小姐大赛合作。 这一个个项目中,我们能看到人工智能"落地"的某种思路。 一是有高手,但高手的供给远远赶不上市场的需求。围棋有李世石,教育有名师,医院有名医……但是这样厉害的人太少了,他们的稀缺构成了某种市场的落差,落差即机会。 二是高手可以用ai模拟。高手的出现当然有天赋的成分,也有海量经验的累积,那么通过海量大数据的反复学习训练,是不是也可以达到和接近高手的水平?阿尔法狗下围棋,第一局败了没关系,它一个晚上立刻自己和自己下了几百万局…… 三是面临海量数据,需要海量人力,有更多个性化的需求。养猪场不可能24小时有专业人员盯着,面试官要面对如山的简历,再强的老师也不可能对每个人都因材施教……这样的领域恰恰是ai的高光区域,你没有千军万马没关系,只要有一个超高算力的ai系统就行了。 四、去辅助人体 近期,《时代周刊》公布了2019年的100大最佳发明。最引人注目的一栏是"Accessibility"、人体辅助功能。这一项目里,由会说话的ai助听器、眼控技术、智能手杖、智能假肢、视听转换等。 同样的突破也在中国发生。在广东,残障人士有一个练习沟通表达的表达社,表达社里出了一个"最佳辩手",这个男生担纲三辩,可以和正常人唇枪舌战,尽管他是一个聋子,听不见任何声音。 听不见任何声音,包括自己的说话声,如何与常人辩论呢? 换一个角度说,在中国约有2.1亿人患有听力障碍,其中7200万人患有中等以上听力障碍,通过助听器、人工耳蜗获得有效助听服务的只有2.5%。 好在AI迅猛发展,人们有了很多办法,比如开发专业的听力障碍app,可以有这样的功能: 一是字幕聊天,别人说的话(线下、视频)可以即时转化为文字,这样一来就交流无障碍了。 二是语言康复训练,通过语音识别、合成和评测,帮助听障人士重新开口,练习普通话,通过拼音、词语、句子、文章循序渐进。 比如广州的这位最佳辩手,就是通过专门的app实现了与正常人的话语交锋,对方辩友的声音都第一时间转化为文字,而长期语言康复训练的他已经可以直接"回怼"了。即便张开口来,声音还不够标准、自然,但这已经是非常了不起的一步了。 围绕这个人群,还有另一个困境:聋哑人士常常通过手语交流,但是对普通大众来说,手语有如天书。在美国,手语翻译的比例是1:120,但是在中国,这个比例远远小于1:10000。这样一个痛点该怎么解决? 国内的公司已经进行了很多探索,一个解决方案是智能手环,聋哑人士戴上后,手环可以自动识别跟踪人手的肌肉信号,把手势转化为文字和动图。 残障人士是不幸的,命运无情剥夺了他们与常人共处的一些能力。但万幸在这个时代,人工智能技术的突进正在打破藩篱、填平沟壑,于是一些历史上不可想象的事情发生了。 其一,文字转语音,图像识别转语音,视觉障碍人士可以"听到"更多了。 其二,语音转文字,手势转语音,聋哑人士可以与正常人交流了。 其三,对于肢体残障人士,智能声控轮椅正在成为一种新的可能。 围绕"无障碍"的目标,人工智能领域的大公司在行动。 腾讯发起"信息无障碍"行动,视障用户可以用声纹加好友,图片语音描述功能可以帮助他们"看见"图片,并且围绕语言障碍人士身份认证需求优化粤事省小程序。 阿里发布助残报告,17万残疾人在淘宝天猫开店,三年销售额近300亿,阿里巴巴达摩院与清华大学人机交互实验室推出了为盲人研发的智能手机膜。 17年以来,科大讯飞发布了"三声有幸"公益计划,从资金到技术,对涉及残障人士的项目进行扶持,对很多语音文字交互的项目无保留地开放底层技术。 在1024开发者节上,相关的技术和案例展示感动了很多人。 在国外,亚马逊、谷歌和苹果的智能音箱成为残障人士的福音,自动驾驶的技术推进也为残疾人的出行带来新的助力。 作为一条垂直赛道,人体辅助的产品和商业模式却非常清晰。 从市场前景看,基于AI的人体辅助是康复医疗行业的未来。根据前瞻产业预测,2022年康复医疗行业的市场规模将达到1033亿元。 从需求和产品模式看,人体辅助的解决方案正在迅速成熟,针对的就是残障人士日常生活沟通的需求和痛点,更像是盲杖、助听器和义肢的智能升级,其使用效果伴随着数据积累和算法迭代不断升级。 从行业前景看,残障人士的"残而不障"将与更多的新技术结合,与物联网技术结合带来更多的智能硬件和可穿戴设备,与机器人技术结合带来更多的陪伴和康复机器人,与VR结合实现更多的情境模拟训练。 五、落地的逻辑 讯飞刘庆峰说人工智能是不是真的进入红利期,一要看有没有看得见摸的着的产出(案例),二要看产出能不能规模化推广,三是要用数据证明实效,节约多少成本、提升多少效率。 那么我们顺着他的话具体看下去,人工智能真正大有可为的领域应该是怎样的? 资源不平衡、优质人力资源(高手)极其稀缺,需要规模人力(时间精力)的领域,或者人力极限之外的领域(残障人士,或者人的时间精力有限无法兼顾的领域),往往就是"有ai需求的领域"。 能获得海量数据,且数据可学习、算法可以训练提升,这就是"有ai能力的领域"。 有需求、有能力,两者结合的地方才会是创业者的"甜区"。 人工智能那么远,又非常近。最后让我们祝福所有还在这个领域求索的创业者,你们都是理想主义者。没错,ai的泡沫已经破裂,但是ai最好的时候也已经到来。