教育房产时事环球科技商业
投稿投诉
商业财经
热点动态
科技数码
软件应用
国际环球
晨报科学
新闻时事
信息智能
汽车房产
办公手机
教育体育
生活生物

MIT的一项研究认为深度学习正在逼近算力极限

  MIT 的一项研究认为,深度学习正在逼近算力极限。
  深度学习需要大量数据和算力,这二者的发展是促进这一次人工智能浪潮的重要因素。但是,近期 MIT 的一项研究认为,深度学习正在逼近算力极限。
  这项研究由 MIT、MIT-IBM Watson AI 实验室、延世大学安德伍德国际学院和巴西利亚大学的研究人员开展,他们发现深度学习的进展「极大地依赖」算力增长。他们认为,深度学习要想继续进步,需要更加计算高效的深度学习模型,这可以来自于对现有技术的更改,也可以是全新的方法。
  该研究作者表示:「我们发现,深度学习计算成本高昂并非偶然,而是从设计之时就注定了。灵活性可以使深度学习很好地建模不同现象并超越专家模型,但也带来了昂贵的算力成本。尽管如此,我们发现深度学习模型的实际计算负载要比理论极值扩展得更加迅速,这意味着可能出现显著改进。」
  深度学习是机器学习的子领域,其算法受到大脑结构和功能的启发。这类算法——通常叫做人工神经网络,包含函数(神经元),网络层负责将信号传递给其他神经元。信号也就是网络输入数据的产物,它们在层与层之间流动,并缓慢地「调优」网络,从而调整每个连接的突触强度(权重)。神经网络最终通过提取数据集特征、识别跨样本趋势来学习执行预测。
  研究人员分析了 1058 篇来自 arXiv 等来源的论文,试图理解深度学习性能和计算之间的联系,尤其是图像分类、目标检测、问答、命名实体识别和机器翻译领域。
  他们执行了两项对算力要求的分析:
  每个神经网络遍历(network pass)所需算力,或单次遍历所需的浮点运算数;
  训练模型所用的硬件负载,即硬件算力,这里以处理器数量乘以计算速率和时间来进行计算。
  研究作者表示,在使用算力几乎相同的情况下,除了英德机器翻译任务以外,在所有基准上都出现了「具备高度统计学意义」的曲线和「强大的解释能力」。
  尤其是,目标检测、命名实体识别和机器翻译在输出结果改进相对较小的情况下硬件负载出现大幅增长,算力对模型在 ImageNet 基准数据集上的图像分类准确率承担了 43% 的贡献。
  研究人员估计,三年的算法改进等于算力的 10 倍增长。「我们的研究结果表明,在深度学习的多个领域中,训练模型所取得的进展依赖于所用算力的大幅增长。另一种可能性是算法改进本身需要算力的补充。」
  在研究过程中,研究人员还推断了模型在不同理论基准上打破记录所需的算力、经济成本和环境成本。
  据最乐观的估计,降低 ImageNet 图像分类误差也需要 105 倍的算力增长。
  去年六月,机器之心发布的报告估计,华盛顿大学的 Grover 假新闻检测模型训练两周所需成本为 2.5 万美元。前不久发布的 OpenAI GPT-3 模型训练成本飙升到 1200 万美元,谷歌 BERT 的训练成本约为 6,912 美元。
  去年六月来自美国马萨诸塞大学阿默斯特分校的研究者发现,训练和搜索特定模型所需算力会排放 62.6 万镑二氧化碳,约等于美国汽车平均一生排放量的五倍。
  「我们无法预测这些目标的计算要求…… 硬件、环境成本和金钱成本将会高昂到难以承受。以更经济的方式达成目标需要更加高效的硬件和算法或其他改进。」
  研究人员注意到,深度学习在算法层面上的改进有过先例。例如,谷歌 TPU、FPGA 和 ASIC 等硬件加速器的出现,以及通过网络压缩和加速技术降低计算复杂度。
  研究人员还引用了神经架构搜索和元学习,它们利用优化找出擅长解决某类问题的架构,进而试图实现计算高效的方法。
  OpenAI 的一项研究指出,自 2012 年以来,训练 AI 模型达到 ImageNet 图像分类任务相同性能所需要的算力每 16 个月减少 1/2。此外,谷歌 Transformer 架构超越了先前的 SOTA 模型 seq2seq(也由谷歌开发),它比 seq2seq 推出晚了三年,计算量是后者的 1/64。
  研究人员在论文最后写道:「深度学习模型所需算力的爆炸式增长结束了 AI 寒冬,并为更广泛任务上的计算性能制定了新的基准。但是深度学习对于算力的巨大需求限制了以目前形式提升性能的路径,特别是在这样一个硬件性能放缓的时代。」
  因此,研究人员认为,算力极限可能促使机器学习转向比深度学习计算效率更高的新技术。
  reddit 热议
  这一话题以及相应论文在 reddit 等社交网站上引发热议,拥趸者有,但质疑声也很多。
  有网友表示,关于深度学习算法复杂性的讨论虽未成为当前主流,但很快会成为焦点话题。发帖者也对这种说法表示认同,并认为过去几年得益于计算能力的显著提升,机器学习领域取得了诸多突破。尽管如此,人们可能会很快关注可持续性和算法效率。
  与此同时,更多的网友对研究中的一些细节问题展开了讨论。
  下面这位网友对论文中的「硬件性能的提升正在放缓」这一说法提出了疑问:「事实真的如此吗?特别是从 USD/TFLOPS 和 Watts/TFLOPS 的角度来看。」
  发帖者也对这位网友的疑问进行了回复,他表示这似乎是作者的论点。论文作者在文中还写道:「深度学习模型所需算力的爆炸式增长结束了 AI 寒冬,并为更广泛任务上的计算性能制定了新的基准。」但遗憾的是,论文作者的这些说法并没有提供参考文献。
  更有网友毫不客气地表示:「虽然这是一个越来越重要的讨论话题,但我并没有从这项研究中看到任何『新』见解。事实上,自 2012 年以来,我们都清楚一些历时 10-30 年之久的旧方法之所以依然能够运行,主要还是得益于算力。」
  在他看来,众多深度学习方法面临的计算限制是显而易见的。可以想象到,如果有人将 GPT-3 的计算增加 100 倍,则会得到 GPT-4。现在,很多科研实验室面临着另一个更大的限制,受制于种种客观因素,它们无法获取更大的算力。
  最后,有网友认为,无论是从理论基础,还是社会影响等多方面来看,机器学习领域「放缓脚步」不失为一件好事。

304不锈钢卷出卷库存卷305和384不锈钢含有较高的镍,其加工硬化率低,适用于对冷成型性要求高的各种场合。308不锈钢用于制作焊条。309,310,314及330不锈钢的镍,铬含量都比较高,为的是提高钢朝鲜再次主张境内无新冠确诊病例近日有关于朝鲜再次主张境内无新冠确诊病例的问题受到了很多网友们的关注,大多数网友都想要知道朝鲜再次主张境内无新冠确诊病例的具体情况,那么关于到朝鲜再次主张境内无新冠确诊病例的相关信科普下厦门大学给物理学新生送钻戒关于到这两天在网上引起网友们热议的话题科普下厦门大学给物理学新生送钻戒,很多小伙伴可能到现在都还没有明白具体的科普下厦门大学给物理学新生送钻戒是怎么一回事,那么既然现在大家对于科普ArsiaMons上空周期性出现的一种神秘的长而薄的云据外媒CNET报道,火星上高耸入云的ArsiaMons火山已经足够令人印象深刻,但当它上方形成一片奇怪的云层时,它就显得格外引人注目。欧空局(ESA)ldquo火星快车号rdquo东城回收废锡膏焊锡膏,主要由助焊剂和焊料粉组成常用焊料的形状焊料在使用时常按规定的尺寸加工成形,有片状块状棒状带状和丝状等多种。1)丝状焊料mdashmdash通常称为焊锡丝,中心包着松香,叫松吃什么提高性能力(增强男性的性功能吃什么最好)睾酮对身体有多重要相信各位健身爱好者都很清楚,无需我们再费口舌。睾酮水平会随着年龄的增长而下滑,但仍有一些措施可以延缓这一趋势,比如积极锻炼合理饮食。本文就介绍一些可以促睾的食物供解说下街溜子华子是什么梗关于到这两天在网上引起网友们热议的话题解说下街溜子华子是什么梗,很多小伙伴可能到现在都还没有明白具体的解说下街溜子华子是什么梗是怎么一回事,那么既然现在大家对于解说下街溜子华子是什tcl是什么牌子(tcl空调是什么牌子)伴随夏季即将来临,又到了要吹空调的季节,在炎炎夏日中,持续的高温让人们都不愿意离开房间,空调几乎成为了夏天的必需品。为了应对不断升高的温度,不少人都准备提前购置空调,但如何挑选一台华夏人寿医保通产品介绍关于到这两天在网上引起网友们热议的话题华夏人寿医保通产品介绍,很多小伙伴可能到现在都还没有明白具体的华夏人寿医保通产品介绍是怎么一回事,那么既然现在大家对于华夏人寿医保通产品介绍都椰浆和椰汁有什么区别(椰浆可以用什么代替)首发于技术型吃货原创QC菌and馨馨有读者问能介绍一下椰果的制作过程吗?买来的椰果罐头与真正椰子里的椰肉质地差好多啊,难道说椰果不是源自于椰肉,而是另一种物质吗?你的感觉是对的。其科普下你有什么可豪横的下一句关于到这两天在网上引起网友们热议的话题科普下你有什么可豪横的下一句,很多小伙伴可能到现在都还没有明白具体的科普下你有什么可豪横的下一句是怎么一回事,那么既然现在大家对于科普下你有什
2020年10月第一批国产网络游戏版号过审名单共67款文章来源科技讯10月16日国家新闻出版广电总局公布了2020年10月第一批国产网络游戏版号过审名单共67款与此前不同的是本批过审版号中并未出现移动端以外的游戏共有67款游戏过审其中借钱一万马上到账的(借钱无需审核立马到账)借钱一万马上到账的(借钱无需审核立马到账)都说职场上的情意薄如纸,交情就是人走茶凉的状态。初入职场的我就是不相信,处处用自己的真心来与每个同事进行将相处,自以为赢得了职场,是个人见科普下抖音前世我种下不断的是牵挂是什么歌歌名渡我不渡她歌手孤独诗人渡我不渡她在线试听httpsy。qq。comnyqqsong0019hpEw1QzwRq。html这首歌其实就是爱而不得的一首情歌,在抖音上人气非常高,翻科普下抖音前世我种下不断的是牵挂是什么歌歌名渡我不渡她歌手孤独诗人渡我不渡她在线试听httpsy。qq。comnyqqsong0019hpEw1QzwRq。html这首歌其实就是爱而不得的一首情歌,在抖音上人气非常高,翻科普下抖音就把这首歌送给失意的你是什么歌关于到这两天在网上引起网友们热议的话题科普下抖音就把这首歌送给失意的你是什么歌,很多小伙伴可能到现在都还没有明白具体的科普下抖音就把这首歌送给失意的你是什么歌是怎么一回事,那么既然俄罗斯黑客试图贿赂特斯拉工厂工人以安装恶意软件当您可以社交化自己的方式时为什么要破解当您只需购买所需的访问权限时为什么还要烦恼社会工程呢这似乎是至少一名俄罗斯人的想法他被联邦调查局逮捕并被指控试图向内华达州的特斯拉GigafaJackpocket欢迎黄健熙担任营销副总裁黄秋生(MichelleWong)已加入杰克珀克(Jackpocket)的领导团队,担任营销副总裁,领导公司的整体营销策略,为他们准备将彩票应用程序推向新州和新市场。MichellFlipkart将五名高管提升为高级副总裁沃尔玛旗下的marketplace将五名高管提升为高级副总裁。Flipkart集团首席执行官在周日发送的一封电子邮件中宣布了ManishKumarAnandLakshminaray瑞幸咖啡召开特别股东大会四名董事罢免议案获通过文章来源科技讯7月6日昨天下午15点瑞幸咖啡召开特别股东大会会议投票通过了对陆正耀黎辉刘二海及SeanShao的董事罢免议案同时会议投票通过了增加YingZeng和JieYang两福特刚买了一家电动滑板车公司。如果你最近在美国一座主要城市的街道上行走,你很可能会被一辆电动自行车绊倒,它们要么在每条人行道上乱扔,要么简化了居民的通勤,这取决于你对它的看法。不管怎样,你现在可以感谢福特了。这诺基亚的宽带业务网络压力的情况下得到了提振芬兰电信设备制造商的一位高管表示,由于其宽带客户争相升级网络,以满足春节期间更高的用户需求,该公司订单出现回升。诺基亚固定网络业务总裁莫特利(SandyMotley)对路透社(Re