教育房产时事环球科技商业
投稿投诉
商业财经
热点动态
科技数码
软件应用
国际环球
晨报科学
新闻时事
信息智能
汽车房产
办公手机
教育体育
生活生物

历经6年AI终于在读图会意上超越人类

  前不久,在中文语言理解权威评测基准CLUE中,阿里巴巴的AI模型在新闻文本上超越了人类识别精确度。现在“读图会意”上,阿里巴巴达摩院在VQA上也超越了人类,这是榜单设立6年来的首次。
  8月12日,国际权威机器视觉问答榜单VQA Leaderboard出现关键突破:   阿里巴巴达摩院以81.26%的准确率创造了新纪录,让AI在“读图会意”上首次超越人类基准。
  继2015年、2018年AI分别在视觉识别及文本理解领域超越人类分数后,人工智能在多模态技术领域也迎来一大进展。
  达摩院AliceMind在VQA Leaderboard上创造首次超越人类的纪录
  “诗是无形画,画是有形诗。”宋代诗人张舜民曾描绘语言与视觉的相通之处。“读图会意”,即通过视觉理解信息,是人类的一项基础能力,但对AI来说却是要求极高的认知任务。
  解决该挑战,对研发通用人工智能有重要意义。近10年来,AI在下棋、视觉、文本理解等单模态技能上突飞猛进,但在涉及视觉-文本跨模态理解的高阶认知任务上,AI过去始终未达到人类水平。
  为攻克这一难题而设立的挑战赛VQA Challenge,自2015年起先后于全球计算机视觉顶会ICCV及CVPR举办,吸引了包括微软、Facebook、斯坦福大学、阿里巴巴、百度等众多顶尖机构踊跃参与,并形成了国际上规模最大、认可度最高的VQA(Visual Question Answering)数据集,其包含超20万张真实照片、110万道考题。
  VQA是AI领域难度最高的挑战之一。在测试中,AI需根据给定图片及自然语言问题生成正确的自然语言回答。
  这意味着单个AI模型需融合复杂的计算机视觉及自然语言技术:  首先对所有图像信息进行扫描,再结合对文本问题的理解,利用多模态技术学习图文的关联性、精准定位相关图像信息,最后根据常识及推理回答问题。
  VQA技术自2015年的进展
  今年6月,阿里达摩院在VQA 2021 Challenge的55支提交队伍中夺冠,成绩领先第二名约1个百分点、去年冠军3.4个百分点。两个月后,达摩院再次以81.26%的准确率创造VQA Leaderboard全球纪录,首次超越人类基准线80.83%。
  VQA的核心难点在于对多模态信息进行联合推理认知,即在统一模型里做不同模态的语义映射和对齐。
  据了解,  达摩院NLP及视觉团队对AI视觉-文本推理体系进行了系统性的设计,融合了大量算法创新,包括多样性的视觉特征表示、多模态预训练模型、自适应的跨模态语义融合和对齐技术、知识驱动的多技能AI集成等,让AI“读图会意”水平上了一个新台阶。
  VQA技术拥有广阔的应用场景,可用于图文阅读、跨模态搜索、盲人视觉问答、医疗问诊、智能驾驶等领域,或将变革人机交互方式。
  报道显示,这不是阿里达摩院第一次在AI关键领域超越人类基准。2018年,达摩院曾在斯坦福SQuAD挑战赛中历史性地让机器阅读理解首次超越人类,引发海外媒体关注。
  今年以来,达摩院在AI底层技术领域动作频频,先后发布了中国科技公司中首个超大规模多模态预训练模型M6及首个超大规模中文语言模型PLUG,并开源了历经3年打造的深度语言模型体系AliceMind( https://github.com/alibaba/AliceMind ),其曾登顶 GLUE等六大国际权威NLP榜单。
  【来源:快科技】【作者:宪瑞】

发动机启停管停不管启超19万台本田明星SUV遭调查一直以来,本田都有买发动机送车的名誉,该公司制造的发动机以皮实耐用强性能而著称。不过近日,一项针对本田在美明星SUV车型Pilot的调查引起了人们的关注。据美国国家公路交通安全管理腾讯优化考核人才评估体系反内卷成为核心主题今天,腾讯发布全员邮件,宣布启动新一轮人才评估体系优化升级,对全集团的人才管理制度进行改革。据媒体报道,腾讯此次改革包括简化绩效考核下放晋升权利与强化干部管理三个方向。在绩效考核中PC电脑回光返照结束今年销量暴跌8。2过去两年的疫情经济下,PC电脑反而受益于远程办公网课的需求,出现了10年来最大的一波增长,可惜这次的回光返照持续不了多久,2022年就要跌回去了,IDC预计今年的PC出货量将暴跌8格局打开了!微软宣布删除竞业限制条款并披露薪酬水平近日,微软宣布,将停止在美国执行现有的员工竞业禁止协议,并保证在2023年前对其人力资源政策进行公民权益审计。同时,微软还表示,将在2023年1月前,在美国各地发布的内部与外部招聘性能功耗相当残暴RTX4090公版卡变样了三风扇镇压上半年眼看就要结束,下半年的PC市场将迎来精彩纷呈的新品发布,其中最受关注之一莫过于NVIDIA新显卡。爆料达人kopite7kimi给出的消息称,AD102核心的RTX40系公版B站发布2022年Q1财报月活人均时长创史高UP主数量出炉6月9日,哔哩哔哩公布了截至2022年3月31日的第一季度未经审计的财务报告。财报显示,B站一季度营收达50。54亿元人民币,同比增长30。随着月均活跃用户数接近3亿大关,B站在新骁龙8再添新机!一加10即将登场直接上150W闪充此前爆料人MaxJambor在社交平台暗示,一加今年没有打算发布一加10机型。官方也没有证实一加10的存在以及推出该手机的计划。不过,爆料人YogeshBrar近日透露,一加目前正中国联通推出华为P50Pro5G通信壳套装6月9日消息,中国联通今日宣布,能让4G变5G的ldquo5G通信壳rdquo将于明日开启预售,6月17日正式开售,售价799元。随后,中国联通还推出了华为P50Pro5G通信壳套Intel12代酷睿无情封杀AVX512指令集看一眼LOGO就知道了AVX512指令集虽然褒贬不一,但一直是Intel的招牌,AMDZen4锐龙7000系列都要借鉴它的AI加速指令。但是在自家酷睿处理器产品上,Intel对于AVX512的支持却一直特斯拉中国5月交付32165辆上海工厂满血复活乘联会发布的中国汽车销量数据显示,5月特斯拉批发销量为32165辆,其中出口22340辆,复工复产速度加快。2022年15月,特斯拉累计交付量为215851辆,同比增长超过50。据Intel发布AtomP系列新品10nm工艺复活27核心只要83W去年2月份,Intel发布了特殊的Atom凌动家族新品,AtomP5900系列,是首款面向无线基站的10nmSoC片上系统,包括P5962BP5942BP5931BP5921B等型
滴滴回应APP被下架将严格按照有关部门要求整改针对APP被下架一事,滴滴出行官微回应称,滴滴坚决落实国家有关部门的相关要求,已于7月3日暂停新用户注册,滴滴出行App将严格按照有关部门的要求下架整改。滴滴方面称,已下载滴滴Ap滴滴出行被网络安全审查周五收盘跌5。3据国家互联网信息办公室官方微信消息,为防范国家数据安全风险,维护国家安全,保障公共利益,依据中华人民共和国国家安全法中华人民共和国网络安全法,网络安全审查办公室按照网络安全审查办法滴滴回应被网络安全审查将积极配合,排查风险针对滴滴被网络安全审查一事,滴滴回应称,将积极配合网络安全审查。全面梳理和排查网络安全风险,持续完善网络安全体系和技术能力。今天,网络安全审查办公室发布公告称,为防范国家数据安全风彭博社谷歌计划在今年8月推出Pixel5a虽然发布时间有所改变,但Google仍计划今年推出Pixel5a。援引彭博社MarkGurman最新爆料,Pixel5a将会在今年8月份发布。在推文中写道ldquoGooglePi英伟达周一盘中超过5000亿美元是英特尔市值两倍多6月29日消息,据国外媒体报道,自5月13日以来,英伟达股价有明显上涨,市值也不断升高,而在周一盘中,英伟达市值更是一度突破5000亿美元,收盘时也接近5000亿美元。当地时间周一分析师称AppStore数据支持6月季度业绩好于预期苹果应用商店6月份的增长估计表明服务表现强劲,增加了摩根士丹利对6月份季度盈利大幅增长的信心。在一份给投资者的说明中,首席分析师KatyHuberty估计AppStore在6月1日DuckDuckGo过去12个月应用下载量突破5000万次主打隐私保护的搜索引擎DuckDuckGo在今天发布的新闻稿中表示,在过去12个月里他们的应用程序下载量超过5000万次,超过了之前所有年份的总和。DuckDuckGo已经走过了1苹果MaciPad在出货量在网上商店开业后出现激增苹果公司在印度首次开设网上店面约九个月后,已成为印度第五大PC品牌。根据研究公司Canalys的新数据,2021年第一季度,苹果的Mac台式机和笔记本电脑以及iPad平板电脑的出货只有台积电联华电子等代工商能生产OLED显示驱动芯片据国外媒体报道,虽然苹果等主要的智能手机厂商,多年前就已开始采用OLED屏幕,苹果从2017年iPhone问世十周年推出的iPhoneX开始采用,到去年的iPhone12系列已全部中芯国际跟台积电有差距?CEO有信心与任何公司比较中芯国际是国内最大最先进的晶圆代工厂,年营收超过270亿元,台积电则是全球最大最先进的晶圆代工厂,年营收超过3000亿元,从体量上就是中芯国际的10倍了,两家企业的比较也是媒体分析中芯国际授梁孟松2400万元股票,留任应稳了根据官方消息,中芯国际(688981)召开了2021年第一次临时股东大会,表决通过了2020年年度报告。此外,股东大会批准了2021年科创板限制性股票激励计划(草案),将授予梁孟松