教育房产时事环球科技商业
投稿投诉
商业财经
热点动态
科技数码
软件应用
国际环球
晨报科学
新闻时事
信息智能
汽车房产
办公手机
教育体育
生活生物

国内科学家团队发布超大规模AI预训练模型

  北京智源人工智能研究院发布四个超大规模人工智能预训练模型,统称为“悟道1.0”,涵盖中文语言、多模态、认知、蛋白质预测四个领域,是帮助国内企业、机构开发人工智能应用的大型基础设施。
  “悟道1.0”由智源研究院学术副院长、清华大学唐杰教授领衔,带领来自北京大学、清华大学、中国人民大学、中国科学院等单位的100余位AI科学家团队联合攻关,同时与快手、搜狗、360、阿里、新华社等龙头企业共同研发工业级示范性应用。
  智源研究院院长黄铁军教授介绍,近几年这轮人工智能浪潮的基本特点是“数据+算力+算法=模型”,模型浓缩了训练数据的内部规律,是实现人工智能应用的载体。近年来人工智能的发展,已经从“大炼模型”逐步迈向了“炼大模型”的阶段,通过设计先进的算法,整合尽可能多的数据,汇聚大量算力,集约化地训练大模型,供大量企业使用,是必然趋势。
  智源研究院2020年10月启动“悟道”项目,研发规模大(主要体现为参数量)、智商高、具备类人认知能力、统一对多模态数据的理解和建模、满足各种应用需要的预训练模型,特别是注重中文语料的采集和训练。
  四大模型:中文、多模态、认知、蛋白质预测
  “悟道”模型技术委员会主任、智源研究院学术副院长唐杰教授介绍,“悟道1.0”先期启动了4个大模型的研发。
  以中文为核心的预训练语言模型“悟道·文源”目前模型参数量达26亿,具有识记、理解、检索、数值计算、多语言等多种能力,并覆盖开放域回答、语法改错、情感分析等20种主流中文自然语言处理任务,技术能力已与GPT-3齐平。
  其目标是构建完成全球规模最大的中文预训练语言模型,在文本分类、情感分析、自然语言推断、阅读理解等多个任务上超越人类平均水平,探索具有通用能力的自然语言理解技术,并进行脑启发的语言模型研究。
  超大规模多模态预训练模型“悟道·文澜”,目前模型参数量达10亿,基于从公开来源收集到的5000万个图文对上进行训练,是首个公开的中文通用图文多模态预训练模型。
  其目标是突破基于图、文和视频相结合的多模态数据的预训练理论难题,并最终生成产业级中文图文预训练模型和应用,并在多个评测应用上超过国际最高性能。
  该模型已对外开放API,并有两款小应用,可以为用户上传的照片配文,或搭配最合拍的音乐。
  面向认知的超大规模新型预训练模型“悟道·文汇”,目前参数规模达113亿,在AI作诗、AI作图、AI制作视频、图文生成、图文检索、复杂推理等多项任务中的表现已经接近突破图灵测试,可以应用在电商行业自动撰写商品文案等场景。
  其目标是研发出千亿至万亿级参数量的、更通用、且性能超越国际水平的预训练模型,搭建预训练模型体系,从认知角度研究通用人工智能,发展模型基于逻辑、意识和推理的认知能力。
  超大规模蛋白质序列预测预训练模型“悟道·文溯”,已在蛋白质方面完成基于100GB UniParc数据库训练的BERT模型,在基因方面完成基于5-10万规模的人外周血免疫细胞(细胞类型25-30种)和1万耐药菌的数据训练,同时搭建训练软件框架并验证其可扩展性。
  其目标是以基因领域认知图谱为指导,研发出十亿参数规模、可以处理超长蛋白质序列的超大规模预训练模型,在基本性能、可解释性和鲁棒性等多个方面达到世界领先水平。
  WuDaoCorpora:全球最大中文语料数据库
  在科研方面,“悟道1.0”取得了多项国际领先的AI技术突破,与现有同类算法及模型相比提升了训练速度,提高了识别准确度和效率。不过更值得一提的是该项目建设并开放了全球最大中文语料数据库WuDaoCorpora。
  WuDaoCorpora数据规模达2TB,超出之前全球最大的中文语料库CLUECorpus2020十倍以上,同时着重去除了数据中包含的隐私信息,防止了隐私泄露。
  WuDaoCorpora的数据来源丰富,包括新闻咨询、评论、百科、论坛、博客、学术论文等,使得该数据集能够适用于不同种类的自然语言处理任务,训练出的模型泛化性更强。
  此外,WuDaoCorpora数据标签的完备性较高,语料中包含医疗、法律、金融等领域标签,可以依据需求抽取某个特定领域的数据,用于训练该领域的模型,也可以用于对大模型进行微调,构建某一特定领域的应用。
  该数据集不仅为“悟道”项目提供了数据支撑,还可被用于中文自然语言处理领域的多种任务模型训练,包括文本生成模型、词嵌入模型、问答对话模型等,对于国际自然语言处理领域的发展将有着积极的促进作用。
  【来源:cnBeta.COM】

SpaceX成功为美国太空部队发射升级版GPS卫星据国外媒体报道,当地时间周四,美国太空探索技术公司SpaceX成功为美国太空部队发射了第五颗GPS卫星,即GPSIIISV05卫星。据报道,GPSIIISV05卫星是洛克希德mid科学家开发出一款能迅速嗅出口臭的小型便携设备据外媒报道,你是否曾担心过自己有口臭,但又不好意思让别人来缓解你的担忧?据美国化学学会发表的一项研究称,这就需要一个最新精细小装置。科学家们称,这个装置只有拇指大小,能够帮助检测出科学家们创造了第一只转基因有袋动物据外媒报道,日本理化学研究所(RIKEN)生物系统动力学研究中心(BDR)的研究人员成功地创造了第一只转基因工程培育的有袋动物。这项研究发表在科学杂志当代生物学上,将有助于破译只在天文学家推动关于巨型卫星星座的全球辩论航空航天公司在过去2年中发射了约2000颗互联网卫星进入地球轨道,使活跃的卫星数量几乎翻了一番。这已经引发了天文学家和其他观星者的担忧,他们担心夜空观测会受到干扰。在下个月的一个联地方不够用SpaceX似乎已破土动工新建90米高高舱据国外媒体报道,美国太空探索技术公司SpaceX似乎已在其位于德克萨斯州博卡奇卡的星际飞船工厂内破土动工,新建一座更大的ldquo高舱rdquo(HighBay)组装厂。尽管Spa科学家在16吨的模拟月壤上进行实验以寻找处理方法据外媒报道,登月任务的重大挑战之一是处理月球表面的细小和粉状的月壤。美国宇航局(NASA)在阿波罗登月时代发现,月壤会粘附在所有东西上,而且很难清除。为了准备将来让人类回到月球表面吸积盘发光的模式因超大质量黑洞质量的不同而不同根据一项新的研究,天体物理学吸积盘发出的闪烁的光可以显示出其中心的超大质量黑洞(SMBH)的质量。这些发现为使用光学观测来描述SMBH的质量提供了一种新的方法,并有助于约束发生在吸Starlink可以扩大服务范围为3000万美国人提供服务根据太空探索技术公司(SpaceX)卫星政策总监DavidGoldman先生本月早些时候向联邦通信委员会提交的报告,该公司的卫星互联网服务Starlink不会完全排除在城市地区提供研究人员在传统计算机上运行复杂的量子计算算法EPFL教授GiuseppeCarleo和哥伦比亚大学一位名叫MatijaMedvidovi?的研究生找到了一种在传统计算机上执行复杂量子计算算法的方法。通常,执行量子软件需要使用科学家研发拇指大小设备可帮我们自主判断是否口臭我们自己是无法判断是否存在口臭的,但让别人闻口臭可能是比较尴尬的事情。但在不久的将来,我们可以通过一种ldquo拇指大小rdquo的便携式设备来轻松自主判断。虽然口臭可能有各种原因朱诺号比任何其他航天器都更接近木星最大卫星木卫三据外媒报道,美国宇航局(NASA)的ldquo朱诺号rdquo探测器比20多年来任何其他航天器都更接近木星最大的卫星木卫三(盖尼米得,Ganymede),为这个冰冷的天体和这颗气态
研究员利用AI对毕加索一幅名画下的隐藏画作进行重建据外媒CNET报道,在成名之前,巴勃罗middot毕加索并不总是有足够的资金来购买绘画材料,因此,像其他挣扎的艺术家一样,他在现有的画布上画画,创作新的作品,从而掩盖了早期的图像。研究发现暴露于普通塑料化学品跟10万例早逝有关据外媒报道,来自纽约大学格罗斯曼医学院的研究人员呼吁采取紧急监管行动来限制在塑料生产中使用名为邻苯二甲酸盐的化学物质。该研究惊人地估计,美国每年有多达10万例过早逝亡可能归因于邻苯毅力号遭遇登陆火星以来的首次火星合日现象据外媒报道,在ldquo火星合日rdquo期间,由于太阳从其外层大气(日冕)中喷出高温高能的气体,远远地穿过太空,这导致我们的无线电信号通信受到干扰。这意味着可靠的通信被排除在外。神舟十三号16日00时23分发射!中国首位空间站女航天员亮相今天下午,空间站阶段飞行任务总指挥部,在酒泉卫星发射中心召开新闻发布会,通报神舟十三号载人飞行任务有关情况。据中国载人航天工程办公室消息,经总指挥部研究决定,瞄准北京时间10月16新太空出差三人组航天员名单公布!经空间站阶段飞行任务总指挥部研究决定,瞄准北京时间10月16日00时23分发射神舟十三号载人飞船。据中国载人航天工程办公室消息,经空间站阶段飞行任务总指挥部研究决定,翟志刚王亚平叶原始陨石中的恒星化石指向在太阳形成前就已死亡古星据外媒报道,一些原始的陨石包含了太阳系最初的构件记录,包括在太阳形成之前死亡的古星中形成的晶粒。研究这些前太阳系颗粒的最大挑战之一是确定每颗颗粒来自哪种类型的恒星。来自圣路易斯华盛BAE系统公司使用激光制导火箭来击落无人机随着无人机越来越多地被用作常见的战争和监视技术,一些政府承包商和机构已经资助了一些项目,研究将无人机击落的新方法。其中BAE系统公司已经测试了一种具有激光制导系统的改良火箭,以击落EPFL科学家开发出了可避免光子反弹的新型拓补电路瑞士洛桑联邦理工学院(EPFL)的科学家们,已经开发出了一种基于拓补的新方法。得益于拓补绝缘体材料的特殊结构,其能够迫使光子和电子仅沿着材料边界单向移动。这些粒子几乎不会遇到阻力,研究表明从海洋中排放的超13DMS并不能帮助形成新云层据外媒报道,站在海边,大口大口地闻着盐雾,你会闻到刺鼻的海腥味。而那种成熟的像是腐烂的气味,则是硫磺。据悉,海洋浮游生物每年向空气中输出超2000万吨的硫磺,主要是以二甲基硫醚(D研究揭示生物大灭绝后灭绝和起源模式发生的变化据外媒报道,斯坦福大学的科学家们在生命如何从大灾难中重新出现方面发现了一个令人惊讶的模式。10月6日发表在英国皇家学会会刊B辑上的研究显示,身体尺寸进化的通常规则不仅在大规模灭绝期SpaceX二代卫星计划遭亚马逊等三家公司反对据外媒报道,SpaceX的Starlink卫星互联网星座正在忙于抵御来自几个竞争对手对其发射第二代卫星计划的批评。据悉,该计划可能通过Starship下一代运载火箭平台进行。根据S