李开复为什么(李开复)
导语
6月8日,应清华大学交叉信息研究院院长、世界著名计算机科学家姚期智院士邀请,创新工场创始人兼董事长李开复博士向清华大学的"姚班"同学做了名为《人工智能的黄金时代》的演讲。姚班,全称"清华学堂计算机科学实验班",是由姚期智院士于2005年创办、致力于培养与美国麻省理工学院、普林斯顿大学具有同等甚至更高水平的计算机科学人才的实验班级。在本文中,李开复博士用浅显的语言较为系统的介绍了人工智能,深度学习等概念,并且指出了人工智能目前面临的瓶颈以及克服方法。要想全面理解人工智能的朋友,绝对不能错过本文。
(图1:李开复博士与姚期智院士合影)
以下是李开复博士演讲正文:
谢谢大家!非常高兴有这个机会又一次来到清华,尤其是在我最尊敬的姚期智教授的邀请和介绍之下。姚教授的姚班在全球已经享有盛名,我从Google到创新工场,看到有非常多成功的工程师,都是在姚老师的培养之下成为了计算机界的顶尖人才。
在讲人工智能之前,我想向大家介绍一下我的一些可能不太为人熟知的背景:其实在进入几个国际大公司任职之前,也就是在30多年前,我就进入了人工智能领域。我是在1980年首先做的自然语言处理,1982年做的计算机视觉,1983做的语音识别,1985年做的人机对弈,1996年做的VR/AR……但我们现在知道,那时候我的这些选择基本上都是非常"糟糕错误"的职业选择,因为每一件事情,我都是在它的黄金时代之前、白银时代之前,甚至破铜烂铁都不是的时代就涉足了。从这个事情上,其实我也想说,做计算机研究这个领域,本身的素质能力当然都非常重要,但是还要在正确的时候选择正确的事情。我在错误的时候太过狂热的跳进了人工智能领域,与此同时,过去的三四十年人工智能也是起起伏伏,一下很火,一下又跌入谷底。
但现在是人工智能的黄金时代。可能各位也会问,凭什么这次说是人工智能的黄金时代?为了说明这个问题,这次我肯定不只用一些理论来说服大家,毕竟我过去也做了这么多"错误的选择"——我今天还带一些实际的数据来跟大家分享为什么我对今天的人工智能充满信心。人工智能有很多分支,其中之一是机器学习,机器学习里面还有一个分支是深度学习,今天我更多的会用深度学习作为案例。
人工智能是一种工具
最近人工智能成为全球热门新闻话题,很多是因为大家看到AlphaGo在几个月前击败了李世石,最近在网上还传出年底之前它要挑战柯杰的消息。但在这个新闻的热度之下,有一点让我觉得很可惜:大家对这个话题讨论的重心都放在了人工智能是不是在模仿人脑,"奇点"是否即将来临这样的问题上,却没有真正人工智能对我们的现实影响。
"奇点"认为未来机器将有各种的智能、人类必须做一些事情来保护自己。我们在座的没有任何一个人能够证明或否定"奇点",但就我个人而言,我认为人工智能要取代人还是一个非常遥远的事情。我觉得我们需要更的事情是人工智能是今天能够拿来用的工具,它能帮助人类解决问题,能取代重复性的工作,能创造商业价值。正因为这个理由,我认为我们今天进入了人工智能的黄金时代。
随便举几个例子:今天很多的工作以后大部分都会消失,比如说翻译,虽然现在还不是做的那么完美,但是每年进步的都很快,再过几年人工的翻译可能就会非常难找到工作了。记者也同样如此,如今90%美联社的文章都是用机器来写的。几乎所有思考模式可以被理性推算的工作岗位,在有足够数据支撑的时候,都会被取代。有人说十年之内一半的工作会消失,有人说十五年之内一半的工作会消失,我觉得这些都是合理的揣测。
我想在座大部分都会相信这个理论,而如果你对此还有怀疑,你可以想想,为什么AlphaGo这么厉害?就是因为它可以动用到几千台机器每天和自己对弈上万盘的围棋,而这人是做不到的;以后为什么自动驾驶会这么厉害呢?因为它可以用它的各种的sensor在路上搜集数据,这不是任何一个司机可以匹敌的。所以这些都是一些必然的过程。
何为人工智能
到底什么是人工智能呢?我觉得大概来说可能是有几个部分。
首先是感知,感知就是包括视觉、语音、语言;然后是决策,刚刚讲的做一些预测,做一些判断,这些是决策层面的;那当然如果你要做一套完整的系统,就像机器人或是自动驾驶,它会需要一个反馈。
(图2:人工智能是什么)
在这些例子上可以看到,感知可能更多的是帮助识别图里面一个婴儿在沙发上抱着泰迪熊这种。在推荐上面,我举的例子是一个用Google now通过你过去做的一些事情推测你下面要做什么,在最下面的例子你会看到有一个无人驾驶的汽车,它有各种的sensor,它捕捉的信息可以用来做最后的决策,比如怎么去操作方向盘、油门、刹车等等的。其实这三件事情的总和就是今天所被归纳为的人工智能。
(图3:人工智能的发展里程碑)
再从博弈、感知决策以及反馈四个方面回顾一下人工智能的发展历程。博弈今天就不讲太多了,但是基本上我可以看到从我在大学做的Othello到Checkers再到DeepBlue chess,经过很长的一段时间,终于有了今天AlphaGo打败了围棋世界冠军。我们从中可以看到,这是一条长达三十多年的路程。
在感知方面,从我的博士论文发表到Nuance成为一个顶尖的公司,从中国诞生了科大讯飞到美国的Deep Face、中国的Face 等等做得越来越好的企业,这些年也有很多的进步。还有一些很特殊的例子,比如最近看到一些搞笑的比较Microsoft Tay在Twitter上开始跟人家交流一下子就讲了一堆不堪的话,就被Microsoft撤回了,所以这里有很多的成功例子,也有很多有趣的事件。
决策方面,从早期Microsoft Office里的工具到Google广告的推荐,然后到金融行业的很多智能决策公司的出现,进步迅速。Google auto mail可能大家还没有看过,但是如果你现在还在用gamil的话,会发现你有时候收到email,Google会跳出来问要不要发回复,有时候它连回复都帮你写好了,而且写的很精确。这也是人工智能的体现。可能以后我们讲话都不用,助理能帮我们搞定,人工智能的助理肯定也是一个方向。
最后是反馈,从CMU Boss早期的无人驾驶到Amazon用Kiva推动物流,再到最近的Pepper、Google car,我们可以看到这个领域过去三四年特别的热,有很多看起来商业化已经做的非常好。
科普深度学习
在这里,我要稍微深度讲一下深度学习。
深度学习是一种神经网络,与但与之前的相比,它的特点是使用了多层网络,能够学习抽象概念,同时融入自我学习,而且收敛相对快速。收敛快速可能是一种技巧,不见得是一个理论,但是有一批人通过它解决了很多重要的问题。
简单的来说,如果我们有很多笑脸,然后我们把笑脸的像素输入到一个神经网络里面去,最后你那儿希望让机器能识别这是姚明,那是马云,但是因为你这个深度学习的网络很深,要一次性学会这么多也会比较困难,所以就需要用到一个比较快速收敛的技巧——自我学习。通过自我学习,机器会逐步从大量的样本中逐层抽象出相关的概念,然后做出理解,最终做出判断和决策。
比如它可以有好几层的nodes和connection,经过这些nodes和connection,它在每一个层次会感知到不同的抽象特征,且一层比一层更为高级。这些都是通过自我学习实现的,而不是人教的。经过自我学习,从一个脸输进去再从同样的一个脸输出来,它就从里面抽象的学习到了一个人的脸重要特征。
(图4:分层无监督训练)
经过这个学习之后,我再去做监督训练,看机器是否能够识别他们,如果不能,就在训练之后做微调。例如,如果我输入了马云的脸,出来的却是王宝强,那训练系统就会告诉你的网络说这个是错误的:这不是王宝强,这是马云。那接下来就是要进行微调,以便于下一次机器看到这个脸时,能识别出是马云的概率高一些,出来王宝强的概率低一些。
(图5:监督训练)
但是这么一调也不能调的太过火了,要不然就会有overtraining的问题,我们就对整个数学公式做一点微调,用大量的数据,不断重复的去教它,经过不断微调,那么它就很可能在多次之后降低识别错误。
其实这一整套理论在二三十年前就已经有了,我在做我博士论文的时候,很多我的同事就在做训练神经网络的工作。
深度学习在最初的时候训练速度特别特别慢,所以比较难进入工业级别或者是应用级别,比如,你的手机是做不来这个的,因为它的速度实在太慢了。但经过这么多年,我们的计算机变的越来越快,另外也有了更多取巧的训练和识别做法,深度学习的应用可能性也发生了变化,它能被应用的领域越来越宽。多年前,我过早的进入了这一领域,但是现在,人工智能大规模应用的时机已经到了。
凭什么这么说?一个很简单的评估标准就是,我们的深度学习或者是任何的机器学习,它是不是超越人类的能力表现,如果超越的话,可能很多应用就会产生。比如在机场,如果机器识别人脸的准确度超过人,那么我们那些边防的人就可能不需要那么多。这并不是说机器不会犯错,而是说既然人不能比机器做的更好,那我不妨就用机器取代。
深度学习的应用领域
在过去的五年,深度学习的准确度从75%多提升到了97%左右,而人的表现准确率大概是95%。从95%到97%听起来只进步了2%,但实际上是把错误率降低了40%,这是很大的进步。如果这种进步持续,未来人工智能必然会超过人类的表现,同时也将可以进入一些可应用的领域。这就是今天我讲人工智能进入黄金时代的证据:在很多领域,也包括我们在face 做的人脸识别,包括了Apple、Google,科大讯飞的语音识别,它们的认知水平将在未来几年的时间内超过人类,而一旦超过人类,应用就会快速的增加。
(图6:深度学习的应用领域举例)
深度学习首先可以应用于识别,包括人脸识别和语音识别等,这些可以用于安防,安检等。
人脸语音的数据来之不易,但是BI,商业的流程、互联网的数据却非常丰富。Google、百度很早就已经在搜索,在广告以及推荐系统里面充分使用了类机器学习技术,解决该推荐什么商品,一个商品怎么定价,在什么位置会卖的最多,应该把这样的产品卖给谁等问题。这一类的推销可以直接产生经济价值,而社交媒体营销,整个互联网广告,这每一个领域都是几十亿,几百亿甚至更大的市场。
将智能用于炒股其实也是一个不错的选择。在国内在国外,很多人都在做这方面创业的工作。利用智能,我可以随时来算一篮子股票和期货应该如何对冲,以寻求最大的利润。顶尖金融分析师也会做这个,但是他不可能把所有的股票的排列组合都考虑一遍,但是机器可以二十四小时不睡觉,每天都在算怎么能赚最多的钱。除此之外,deep learning深度学习的技术可以把各种的因素都融合进来,比如这个公司的高管有没有变动,今天出了什么新闻,行业里还有没有什么变动……甚至你可以对一个智能系统说如果明天巴西发生了地震,什么股票该被购买,甚至你可以说发生了地震不要问我,你直接去买它就可以了。
银行保险方面,比如说贷款该不该审批,则无论是银行的贷款,还是P2P的贷款,都可以通过机器来判断,而且数据未必要来自银行内部。
医学方面,因为我自己生过病,也深深的受过这方面的痛苦,我也感觉到在今天的医生的判断真的不是最完善的。一方面医生有好有坏,顶尖的医生是非常少的;第二方面比如在癌症方面,它每一年都有新的药出来,那每个医生每天忙着看病人,就不见得有时间去研究这些药物,那些药物也不是每个国家都可以使用的。还有就是每一个人,他的各种特质,不见得就适合用这个药。这些其实都是可以用机器学习来做出来的。
前一阵我在美国碰到了一些科学家,他们正在用机器学习的方法来发明新药。我们的科学研究方面当然要有聪明的头脑和很好的实验,但是其中有一个很关键的部分,就要是一定的程度去排列组合:试很多东西,对小白鼠先试试这个有没有用,再试试看那个有没有用,然后再在猿猴身上实验,再进行人体实验。在以前,这整个过程都是由人脑完成,但是这个交给机器来做也许会更精准。甚至有一家公司它养了非常多的白老鼠,他里面所有的实验都是通过机器学习精准进行:每天白老鼠活了几只,死了几只,什么药可以进到下一步……这些都是靠机器学习加上非常精密的系统来做。
我们发明的很多新的材料,都不是靠纯粹的科学方法推出来的,也是去试一试,把这个碰到那个,就产生了有很特殊效应的材料。这些知识都可以输入我们的信息学习系统,通过它我们可以帮助发明新的事物。
在教育方面也有应用。在学习的过程中,如果基础没有打好,下一个层次根本学不下去。智能化的教育系统会识别你的学习水平,然后根据你的水平确定学习内容。比如,你的乘法没有学好,机器就不可能让你去学除法。
当然学习外语也是很好的例子,我们今天的语音识别做的这么好,为什么我们学外语还是一定要找外教,为什么语音识别不能再上一层楼呢?所以,当你的技术一提高了,语音识别应用就不会只是我的讲话进去然后文字出来,它还有可能用在教育领域。
在这么多机会之下,这个人工智能会重塑亿万级别的领域。当然这个不是明天就会发生,因为我觉得人工智能在很多方面还是相当大的欠缺……
破腹多少钱(重庆剖腹产多少钱)楼主是今年3月底入院贵阳市妇幼保健院生产,4月1号出院,产科主任给楼主做的剖腹产手术。医保即时结算,住了7天院,居然只花了1775。98块钱,顿时感觉在其他消费都很高的大贵阳,生娃
剖腹产后多久可以洗头(剖腹产产妇几天能洗头)凡是做母亲的都应该知道月子里最难熬的事情之一大概就是个人卫生问题了,无论是刨宫产还是顺产从孩子出生那天起,做母亲的一边自己恢复身体一边照顾孩子,因为自身身体比较虚弱,所以就没有办法
突然掉发什么原因(掉一块头发是怎么回事)鬼剃头最快的治疗方法最近头发一块一块的掉,是斑秃吗福州华研皮肤科医生告诉大家,在生活中,我们常常遇到许多的烦心事儿,头发有鬼剃头就是其一。头发有斑秃给我们带来很多的烦恼,比如形象不
狗狗掉毛多久(狗狗冬天掉毛要掉到什么时候)在正常情况下,狗狗每年三月到五月份和十到十一月份都会出现掉毛的情况。这两个阶段由于狗狗处于换毛期,因此掉毛比较严重。除了这生理性的原因外,狗狗出现以下问题也会出现严重的掉毛,因此宠
女人为什么掉头发(女生掉发的解决方法)头发脱落属于正常的生理现象,研究发现每天成年人需要掉100根左右的头发,但是部分女性每次梳头或者洗头发的时候掉头发非常厉害,这让他们很害怕,到底是什么因素引起的呢?为什么女性掉头发
奶水不够吃什么最下奶(吃什么奶水会增多)文丨饭饭妈每一个孩子在出生后,家长都希望对其进行母乳喂养,这样能够给予孩子更加丰富的营养。但是想要实现母乳喂养,其实是存在着一定的局限性的。因为这件事情并没有想得那么简单,每位母亲
为什么会奶水不足(最近奶水渐渐变少了怎么办)妈妈们在哺乳期间,如果奶水变得越来越少,那么孩子肯定是不够喝的,这个时候就需要另外准备奶粉,奶粉喂养肯定没有母乳喂养那么方便,没有那么有营养,所以可以用促进乳汁分泌的方法让奶水变得
哺乳期吃什么奶水多(吃什么食物母乳多)在我们传统的认知里,产后坐月子至关重要。这不仅关系到宝妈的身体恢复,甚至还可能影响今后的身体状况。重要的是,妈妈月子没坐好,不仅自己受罪,还可能累及宝宝。宝妈不管在身体还是情绪出现
多久可以知道怀孕(什么时候知道怀孕了没有)一般来说在正常排卵日同房之后一周左右。可以通过尿液来检测是否有怀孕,而一般建议用晨尿更为准确,但此时假阴性率会比较高,最准确的测量时间是下一次月经时间推迟的710天左右,此时用早孕
怀孕多久涨奶(怀孕不涨奶是怎么回事)近日,很多孕妈妈咨询表示孕晚期涨奶正常吗?其实这是正常的现象,那至于孕晚期为什么会涨奶,下面我们就来具体了解下吧。孕晚期涨奶正常吗其实孕晚期涨奶是一种很正常的现象,很多孕妈妈都会出
怀孕多久胸涨(怀孕多久会胸疼胸胀)在备孕中的女性对怀孕和生孩子往往是既期待,又忐忑,因为毕竟怀孕给女性带来的变化是非常大的,不仅是在孕期,在孕期结束后也会持续很长一段时间。怀孕以后,不少准妈妈发现自己的乳房发生了一
内蒙古清水河县(内蒙清水河县旅游景点)内蒙古清水河县(内蒙清水河县旅游景点)6月3日,清水河县乡村振兴局正式挂牌成立。县委副书记政法委书记王志强,县委常委组织部长马建春,政府党组成员张如刚参加揭牌仪式,并为清水河县乡村
龙涎香是什么(龙涎香对女性有害吗)如果说甄嬛传里谁对皇帝的爱毫无保留,那么非华妃莫属。在她的眼里,哪怕皇宫三年一选秀,各色美女层出不群,可她绝对是独一无二的存在,这底气就来自皇帝为她亲手调制的欢宜香,可皇帝呢,在欢
牧羊犬滑滑板下30级楼梯近日牧羊犬滑滑板下30级楼梯登录了热搜,也是在网上引起了网友们的关注,那么很多小伙伴可能还不清楚具体的情况如何,小编也是在网上查阅了一些信息,那么接下来就分享给大家来了解下牧羊犬滑
牧羊犬滑滑板下30级楼梯近日牧羊犬滑滑板下30级楼梯登录了热搜,也是在网上引起了网友们的关注,那么很多小伙伴可能还不清楚具体的情况如何,小编也是在网上查阅了一些信息,那么接下来就分享给大家来了解下牧羊犬滑
2mm是多少(2cm实际图片)腕表之家钟表技术伯爵AltiplanoUltimateConcept超薄表,是目前世界上最薄的手表,厚度只有2毫米。虽然在很长一段时期,伯爵积家宝格丽,一直在竞争世界最薄名表的位置
微博中毒(微博里点链接能中毒吗)微博中毒(微博里点链接能中毒吗)榜妹只是想放松一下,刷刷微博,却被满首页的333333刷屏了!几乎是同一时间,不论是搞笑情感漫画等类别的微博大v,还是一些品牌蓝v都发布了相同的一条
杜甫的绝句(语文绝句学习重点解析)杜甫的绝句(语文绝句学习重点解析)三年级下册语文(五四制部编教材)1古诗三首绝句学习要点解析绝句杜甫df迟日江山丽,春风花草香。泥融飞燕子,nrng沙暖睡鸳鸯。yunyng一注释迟
化学反应(化学反应设计单原子催化剂了)化学反应(化学反应设计单原子催化剂了)据外媒报道,塔夫茨大学伦敦大学学院剑桥大学和加州大学圣塔芭芭拉分校的研究人员已经证明,催化剂确实可以成为一种变革的媒介。在周二发表在科学杂志上
导光光纤(光纤导光系统系统简介)导光光纤(光纤导光系统系统简介)光学导光系统光学导光系统的作用是将激光器输出的激光引导到聚焦系统或匀光系统。常用的导光系统有光纤导光系统多关节式导光系统等。光纤导光系统的原理和要求
吃醋怎么办(女生对闺蜜占有欲太强正常吗)你身上有头发!说,那个女人是谁?!你身上一根头发都没有?说!那个光头的女人是谁?大家是否遇到过这种情况,女朋友因为一些小事而吃醋,怎么哄都哄不好。你的所有道歉和劝解,在她面前都变得
西门金街(通州西门金街常现餐厨垃圾大量堆积,究竟为何?)西门金街(通州西门金街常现餐厨垃圾大量堆积,究竟为何?)十一假期前厨余垃圾问题再不解决,我们真是不知道怎么做生意了。日前,有热心读者向北青社区报吐槽称,近一个月时间以来,通州西门金