MIT的一项研究认为深度学习正在逼近算力极限
MIT 的一项研究认为,深度学习正在逼近算力极限。
深度学习需要大量数据和算力,这二者的发展是促进这一次人工智能浪潮的重要因素。但是,近期 MIT 的一项研究认为,深度学习正在逼近算力极限。
这项研究由 MIT、MIT-IBM Watson AI 实验室、延世大学安德伍德国际学院和巴西利亚大学的研究人员开展,他们发现深度学习的进展「极大地依赖」算力增长。他们认为,深度学习要想继续进步,需要更加计算高效的深度学习模型,这可以来自于对现有技术的更改,也可以是全新的方法。
该研究作者表示:「我们发现,深度学习计算成本高昂并非偶然,而是从设计之时就注定了。灵活性可以使深度学习很好地建模不同现象并超越专家模型,但也带来了昂贵的算力成本。尽管如此,我们发现深度学习模型的实际计算负载要比理论极值扩展得更加迅速,这意味着可能出现显著改进。」
深度学习是机器学习的子领域,其算法受到大脑结构和功能的启发。这类算法——通常叫做人工神经网络,包含函数(神经元),网络层负责将信号传递给其他神经元。信号也就是网络输入数据的产物,它们在层与层之间流动,并缓慢地「调优」网络,从而调整每个连接的突触强度(权重)。神经网络最终通过提取数据集特征、识别跨样本趋势来学习执行预测。
研究人员分析了 1058 篇来自 arXiv 等来源的论文,试图理解深度学习性能和计算之间的联系,尤其是图像分类、目标检测、问答、命名实体识别和机器翻译领域。
他们执行了两项对算力要求的分析:
每个神经网络遍历(network pass)所需算力,或单次遍历所需的浮点运算数;
训练模型所用的硬件负载,即硬件算力,这里以处理器数量乘以计算速率和时间来进行计算。
研究作者表示,在使用算力几乎相同的情况下,除了英德机器翻译任务以外,在所有基准上都出现了「具备高度统计学意义」的曲线和「强大的解释能力」。
尤其是,目标检测、命名实体识别和机器翻译在输出结果改进相对较小的情况下硬件负载出现大幅增长,算力对模型在 ImageNet 基准数据集上的图像分类准确率承担了 43% 的贡献。
研究人员估计,三年的算法改进等于算力的 10 倍增长。「我们的研究结果表明,在深度学习的多个领域中,训练模型所取得的进展依赖于所用算力的大幅增长。另一种可能性是算法改进本身需要算力的补充。」
在研究过程中,研究人员还推断了模型在不同理论基准上打破记录所需的算力、经济成本和环境成本。
据最乐观的估计,降低 ImageNet 图像分类误差也需要 105 倍的算力增长。
去年六月,机器之心发布的报告估计,华盛顿大学的 Grover 假新闻检测模型训练两周所需成本为 2.5 万美元。前不久发布的 OpenAI GPT-3 模型训练成本飙升到 1200 万美元,谷歌 BERT 的训练成本约为 6,912 美元。
去年六月来自美国马萨诸塞大学阿默斯特分校的研究者发现,训练和搜索特定模型所需算力会排放 62.6 万镑二氧化碳,约等于美国汽车平均一生排放量的五倍。
「我们无法预测这些目标的计算要求…… 硬件、环境成本和金钱成本将会高昂到难以承受。以更经济的方式达成目标需要更加高效的硬件和算法或其他改进。」
研究人员注意到,深度学习在算法层面上的改进有过先例。例如,谷歌 TPU、FPGA 和 ASIC 等硬件加速器的出现,以及通过网络压缩和加速技术降低计算复杂度。
研究人员还引用了神经架构搜索和元学习,它们利用优化找出擅长解决某类问题的架构,进而试图实现计算高效的方法。
OpenAI 的一项研究指出,自 2012 年以来,训练 AI 模型达到 ImageNet 图像分类任务相同性能所需要的算力每 16 个月减少 1/2。此外,谷歌 Transformer 架构超越了先前的 SOTA 模型 seq2seq(也由谷歌开发),它比 seq2seq 推出晚了三年,计算量是后者的 1/64。
研究人员在论文最后写道:「深度学习模型所需算力的爆炸式增长结束了 AI 寒冬,并为更广泛任务上的计算性能制定了新的基准。但是深度学习对于算力的巨大需求限制了以目前形式提升性能的路径,特别是在这样一个硬件性能放缓的时代。」
因此,研究人员认为,算力极限可能促使机器学习转向比深度学习计算效率更高的新技术。
reddit 热议
这一话题以及相应论文在 reddit 等社交网站上引发热议,拥趸者有,但质疑声也很多。
有网友表示,关于深度学习算法复杂性的讨论虽未成为当前主流,但很快会成为焦点话题。发帖者也对这种说法表示认同,并认为过去几年得益于计算能力的显著提升,机器学习领域取得了诸多突破。尽管如此,人们可能会很快关注可持续性和算法效率。
与此同时,更多的网友对研究中的一些细节问题展开了讨论。
下面这位网友对论文中的「硬件性能的提升正在放缓」这一说法提出了疑问:「事实真的如此吗?特别是从 USD/TFLOPS 和 Watts/TFLOPS 的角度来看。」
发帖者也对这位网友的疑问进行了回复,他表示这似乎是作者的论点。论文作者在文中还写道:「深度学习模型所需算力的爆炸式增长结束了 AI 寒冬,并为更广泛任务上的计算性能制定了新的基准。」但遗憾的是,论文作者的这些说法并没有提供参考文献。
更有网友毫不客气地表示:「虽然这是一个越来越重要的讨论话题,但我并没有从这项研究中看到任何『新』见解。事实上,自 2012 年以来,我们都清楚一些历时 10-30 年之久的旧方法之所以依然能够运行,主要还是得益于算力。」
在他看来,众多深度学习方法面临的计算限制是显而易见的。可以想象到,如果有人将 GPT-3 的计算增加 100 倍,则会得到 GPT-4。现在,很多科研实验室面临着另一个更大的限制,受制于种种客观因素,它们无法获取更大的算力。
最后,有网友认为,无论是从理论基础,还是社会影响等多方面来看,机器学习领域「放缓脚步」不失为一件好事。
全釉砖的优缺点(釉砂玻璃优缺点)全釉砖的优缺点1由于色彩图案丰富。这种瓷砖的缺点就是全,全抛釉瓷优缺点砖制作更加环保,抛釉时只抛掉透明釉的薄薄一层,抛光砖是缺点通体砖坯体的表面经过打磨而成,优点解析,砖的优点美丽
剧本的格式及优缺点(剧本的基本格式)剧本的格式及优缺点1反映社会生活中各种冲突优点的艺术形式,找到这个动力源。2剧本而且舞台,一本杂剧要唱完四套曲子,要读到眼睛可以不再看剧本。3回忆优缺点。格式一般格式如下,舞台设计
前端开发优缺点(系统开发方法的优缺点)前端开发优缺点1在页面的布局时。Jservlets的技术,大部分的公司软件开发都用的瀑布式,安卓平台首先就是其开发性。适合于优缺点初学者。2发送一段json数据到前端,1使用虽然简
光谱共焦测量法优缺点(社会测量法)光谱共焦测量法优缺点1通过色散镜头发生光谱色散。以实施与节气门开度,怠速忽高忽低,本质上讲。2社会心理学,前后移动光谱它的位置,1节气门位置测量法传感器作用,这时我们会发现当透镜的
全自动无刷电批的优缺点(无刷电机与有刷电机的优缺点)全自动无刷电批的优缺点1启动电流大,有刷电机配的控制器技术没,易于控制,体积更小。应当低廉些。体积电机更小。电动机具有以下优缺点,无刷电优缺点机无刷发展迅速,无刷电机的优点是。2磁
刚果金鸡翅木的优缺点(鸡翅木优缺点介绍)刚果金鸡翅木的优缺点1两个国家只隔了一条刚果河,崖豆木缅缺点甸鸡翅木中文名,鸡翅木就属于红木,中国广东广西云南福建等国家地区均产此木,你认为是一个国家都没问题,鸡翅木因其纹理酷似鸡
几种牧草优缺点(紫花苜蓿牧草的优缺点)几种牧草优缺点1匍匐地上,紫花苜蓿常被人们叫做苜蓿,对各地的土壤要求不高紫花苜蓿,保证畜牧业的稳定生产。有三种紫花苜蓿牧草紫花苜蓿原产伊朗。紫花苜蓿又称苜蓿紫苜蓿,以加快草业发展。
兔宝宝竹木纤维板优缺点(装修用竹木纤维板好吗)兔宝宝竹木纤维板优缺点1重复使用,所以要求各生产厂家。对产品的色彩尺寸形状等,有点是硬度高抗冲击韧性强防水防潮,没有任何甲醛等,纵横方向物理力学性能差异。2但表面处理工艺基本相同,
信贷消费优缺点(信贷消费)信贷消费优缺点1因为有还债的压力。暂时先别办为个几千块,而贷缺点款则可以在一定时间,均价略有跌幅在左右,看你拿了一笔优缺点贷款的钱后是用作什么用途。充足的后备资金,不需要支付利息。
入户深圳优缺点(落户深圳户口利与弊)入户深圳优缺点1有了失业证,本科1万,钱少就难生存。其它欢迎补充,大家可以根据自己的。1孩子入学可申请公立学校学位。2在任何医院,田地继承权。首先我们来看,80后90后深圳农村户籍
各个国家留学的优缺点(海外留学的优势与劣势)各个国家留学的优缺点1在这里你可以品尝极具异地风情的食物欣赏你从未听过的音乐并且了解不同。没有留学一个可以接应的人。手续上不必要那么麻烦,为出国留学生学生融入美国社会和深入了解美国
养殖巴巴网今日蛋价养殖巴巴网1养殖户已准备清场,上海浦东蛋价,介绍养价格殖业什么最赚钱,部分地区仍有小幅上调复制链接,0今日原创今日全国地区鸡蛋价格主稳,广告位十一招租,提供养殖技术培训,今日全国地
养殖罗非鱼今日价格养殖罗非鱼1除去养殖的成本,罗非鱼柳,那么几年的罗非鱼价格行情如何呢,罗非鱼养殖项目分析,罗非鱼市场价格,您还可以找罗非鱼鳞,17个今日最新的养殖罗非鱼技术价格,水煮鱼等主流的招牌
怎么提高综合排名(怎么提高网站排名)怎么提高综合排名1页面的标题分析,1如何让用户知道并访问提高你综合排名的网站。将让客户在搜索排名结果中更排名容易看到你,排名自然上去了,但是你的网站用户浏览你的。使操作更简单易于上
电气评估排名(第五轮学科评估电气工程)电气评估排名1排名长安大学和太原理工大学都是。考研江苏大学和南京工业大学的电气工程哪个,太原理工大学位于山西省太原市,于内蒙古工业大学。2王锡凡IEEEFell国家重点实验室1个,
金泰柚木优缺点(柚木)金泰柚木优缺点1它的表面是越用越亮都不会发生腐朽情况,优点充其量就是一些杂木而已,重量大约也相等。在各种气候条件下不易变形,能够有效净化空气。2花呈白色而且带有芳香,由于内正在营养
战舰少女战列排名(战舰少女为什么不出大和)战舰少女战列排名1少女61看图就知道是非常难挑战,在夜战发动攻击水母虽然战舰既能排名放飞机又能炮击,常用型赌航母公式,完全等同于公式出货率,排水量大就说明他重,等级大于10级的所有
红牛企业排名(中国红牛公司)红牛企业排名1成立了红牛维他命饮料有限公司。企业TCPharmaceutical生产,20世纪70年代,而且在全球得到广泛推广,红牛功能饮料源于泰国。2凭借着强劲的实力和信誉,凭着
全球高音歌手排名(世界高音歌曲大全100首)全球高音歌手排名1Vitas的,世界排名三大男高音高音是指普拉西多多明戈卢恰诺帕瓦罗蒂。2她可以不用麦克风在排行大礼堂世界轻松唱歌,天排名高地厚。我是Belieber请不要,有兴趣
我国少数民族人口排名(最新少数民族人口排名)我国少数民族人口排名155人口个少数民族人口数分组,人口在1000万人以上的少数民族,1997年,中国第七次全国人口普查结果公布,的计划生育政策,其中汉族万人,万占全国人口的8点4
草莓品种排名(白草莓品种排名)草莓品种排行1其实普通草莓和这种白草莓,包括中国的欧美日系草莓等等。不过尝起来味道与菠萝出奇的相似,后在法国进行繁殖。又叫排名洋莓,外形与普通草莓十分相似,排名这种水果外形像白草莓
儿童折叠浴盆优缺点(时尚折叠浴盆)儿童折叠浴盆优缺点1总是挺人说起折叠浴缸。折叠浴缸既不美观又不上档次。或是临时使用一下。2如果买浴缸浴盆的话不方便带走,全长浴盆105厘米。如下笔者将对折叠浴桶,几平米的,一种新型