教育房产时事环球科技商业
投稿投诉
商业财经
热点动态
科技数码
软件应用
国际环球
晨报科学
新闻时事
信息智能
汽车房产
办公手机
教育体育
生活生物

揭秘搜狗全球首个手语AI合成主播幕后

  搜狗近日发布了最新一代AI合成主播——全球首个手语AI合成主播“小聪”,从技术上给听障人士获取信息、更好融入社会提供了一种新帮助。
  根据世界卫生组织发布的最新数据显示,全球有约4.66亿人有听力障碍,在我国听障人员有2700万人。由于受教育程度参差不齐,除了文字,手语仍是听障人士的第一语言。
  手语AI合成主播“小聪”是基于搜狗人工智能和AI分身技术打造的“数字人”,以打造聋人真正可懂的通用手语播报为目标。“小聪”集成了3D数字人建模、机器翻译、多模态数字人生成、迁移学习、实时面部动作生成及驱动等多项AI技术。在组织的聋人可懂度测评中,“小聪”的手语播报可懂度可以达到85%以上。
  手语AI主播创意源于一次网友交流
  谈及搜狗打造全球首个手语AI合成主播的初衷,搜狗AI交互技术部总经理陈伟回忆道,2019年的时候看到微博上有一位聋人朋友吐槽自己的搜狗语音没法正常用,无法和朋友交流。在通过私信沟通帮他解决问题后,我们意识到其实听障群体对信息获取这件事情特别有期待。如何更好的用搜狗的技术帮助听障人群获取信息,此后我们开始思考并行动。
  事实上,搜狗在AI合成主播领域已深耕多年。从2018年首次推出AI合成主播到现在,搜狗“数字人”技术已经进行了多次迭代进化。
  但是,和有声语言不同,手语是一种视觉空间语言,以表形表意为主,是通过手势、表情、唇动、姿态等方式来表达的。这也意味着手语拥有自身独特的表达逻辑和特点,比如手语表形度高、词性结构不发达、语序语法结构独立等等。
  详细来说,手语的语序,跟汉语语序表达不一样的地方;在词汇方面,手语里没有虚词,没有量词;手语里特有的非手控的信息,比如说表情、口动、身体的朝向这部分在语音语言里是没有的。
  相比较搜狗此前推出的数字人语音主播,手语主播“小聪”背后又有哪些技术思考和突破呢?
  手语AI主播的“超”能力
  “如何把手语语言体系进行计算机应用转化,这件事此前业内并没有特别明确的做法。”,陈伟分析认为,要做出真正让聋人可懂的手语“数字人”,需要解决三个问题:一是,完成手语语言向计算机语言转化。二是,实现健听人和聋人两种语言之间高效高质量转换。三是,驱动“数字人”做出逼真的自然连贯的手语动作和面部表情。
  在明确了要解决的问题后,搜狗技术产品团队开始有针对性的逐一突破。
  陈伟称,要解决上面三个问题,第一需要把手语词汇转化成文字或技术方式标注出来;第二需要构建健听人语序和聋人之间语序之间的平行语料对,这需要大量的机器翻译库;第三需要通过捕捉的方式,预先捕捉大量的真人动作和表情数据,这些数据用来做模型训练。
  另外,陈伟强调,此前搜狗做3D AI合成主播时一直强调唇形,最多加上表情。手语AI合成主播还需要加入更多新的维度,比如主播的嘴形、表情、姿态、手部动作一定要保证在同一时间完成。如果嘴形或动作有提前或滞后情况,这样给人的感觉就是表达不够准确。所以技术上要做到充分对齐,通过多模态端到端生成模型进行联合建模及预测,生成高准确率的动作、表情、唇动等序列。
  针对手语AI主播项目,搜狗除了内部组建了语言、产品和研发体系外,还专门设置了一个“顾问团”。
  据说,顾问团由三类型人员组成,一部分是国家官方聋协和残联标准部门专家;一部分是手语学校的老师,能够听懂声音,同时也能打好手语,做手语教学的人;第三部分是手语的使用者,也就是聋人。通过把手语语言专家、工程师、研究员、实际用户集中在一起,持续沟通、产品迭代,最终打造出全球首个手语AI合成主播“小聪”。
  现在,在数字人效果方面,“小聪”使用了3D重光照扫描还原、面部肌肉驱动、表情肢体手势捕捉技术,生产出了高度还原真人发肤、形象逼真、动作自然生动的数字人模型,手语播报的真实感与亲切感大幅提升。
  手语表达方面,“小聪”能够实现健听人语言与听障者手语语言的机器翻译能力,基于输入的健听人语言能够低延迟生成高准确率的手语语言表征,快速生成数字人手语播报视频,达成信息有效传递。
  手语展现方面,“小聪”可以完整实现手控信息及非手控信息的表达,手语表征信息,覆盖手部动作、面部表情、口动唇动等多个维度,达到自然、地道、接受度更高的手语表达效果。
  自2018年发布全球首个AI合成主播至今,搜狗的“数字人”已经广泛应用于广电、媒体、金融、证券、保险、司法、教育、气象等诸多领域。陈伟透露,搜狗手语AI合成主播预计今年年底将实现大规模应用。
  【来源:Techweb】【作者:果青】

Windows10的继任者将自带处理器调度方面的改进微软将于6月24日公布下一版Windows的名称,有报道称,下一代桌面操作系统将被称为Windows11。该公司在内部将其下一代操作系统称为代号SunValley和Cobalt,但尼康宣布正在研发Z28mm40mm定焦镜头,主打轻便6月6日消息尼康于本月发布了50mm105mm两款Z卡口微距镜头,均适配Z全画幅微单。根据外媒camerajabber消息,尼康官方又宣布,Z28mmf2。8和Z40mmf2。0两全球第一!宁德时代前4月动力电池份额占比高达32。5日前,市场调研机构SNEResearch发布了今年14月份全球动力电池装机量数据。数据显示,今年4月全球动力电池装机量达到17。5GWh14月累计装机量从去年同期的26。8Gwh增创业板首家!宁德时代市值首次突破1万亿5月31日消息,今日早盘,宁德时代高开高走,一度涨近5,盘中触及历史高位429。90元股,总市值突破1万亿元,创业板首家万亿市值公司诞生,创造历史。截至当日午盘,其股价仍大涨4。4微软将于6月24日发布下一代Windows6月3日消息,据国外媒体报道,微软周三宣布将于6月24日发布下一代Windows。微软的Windows发布会将于美国东部时间上午11点,北京时间23点召开,微软首席执行官Satya外媒特斯拉申请新商标寻求进入餐饮业据国外媒体报道,根据向美国专利商标局提交的一份新商标申请,特斯拉首席执行官埃隆middot马斯克(ElonMusk)正寻求进入餐饮业。根据5月27日的备案文件,该公司申请了三个新商华为正式发布鸿蒙手机操作系统9年前的备胎转正昨天的发布会上,华为正式发布鸿蒙手机操作系统,官方的名字是HarmonyOS2,华为要做自己的OS系统了,独立于安卓iOS系统,只需要一个系统就可以连接,能够覆盖内存小到128K,AppleMusicforArtists页面更新提供新资源工具苹果今天对AppleMusic艺术家网页进行了全面优化,为该平台上的乐队音乐家和创作者提供了新的信息资源和工具。artists。apple。com网站主要服务于AppleMusic2020年苹果AppStore销售额达6430亿美元增长246月3日消息,据国外媒体报道,苹果周三表示,根据公司委托进行的一项研究称,AppStore在2020年达到了逾6430亿美元销售额,比上一年的5190亿美元增长24。报告主要关注疫越来越多用户收到鸿蒙OS2。0升级更新后流畅顺滑6月2日华为举办了鸿蒙操作系统及华为全场景新品发布会,不少人期待多时的HarmonyOS2。0正式推出,而现在这款系统已经有部分用户收到了升级通知。此次发布的HarmonyOS2采全系MiniLED!曝新MacBookPro屏幕供应商即将出货前段时间,苹果正式发布了新一代的iPadPro,该设备最大的亮点就是升级了M1芯片和MiniLED显示屏,在发布之后饱受好评,尤其是这块顶级的屏幕深受用户青睐。据此前消息,苹果接下
特斯拉去年四季度营收177亿美元全年超过500亿美元据国外媒体报道,电动汽车厂商特斯拉在当地时间周三发布了去年四季度的财报,在电动汽车产量及交付量创下新高的推动下,他们这一季度及全年的营收均创下了新高。财报显示,特斯拉在去年四季度营福特开始向客户交付首批ETransit电动货运车随着通用汽车(GM)的Brightdrop和Rivian的加入,电动货运车正在迅速成为相当大的业务。但福特并不满足于让他们享受所有的乐趣,所以它想出了ETransit,现在,根据福苹果发布iOS15。4和iPadOS15。4Beta2新增TaptoPay等功能苹果今日(当地时间2月8日)向开发者发布了iOS15。4和iPadOS15。4的第二个测试版用于测试,虽然没有像在第一个测试版中能够得到的那么多新功能,但有一些明显的增加和变化值得TheWrap说TikTok破坏Android和iOS安全性的报道太过夸张早前有报道指出,TikTok绕过了设备的安全防线,以访问ldquo完整的用户数据rdquo。但在TheWrap看来这样的表述不仅夸大其词也是对苹果隐私技术的一个误解mdashmdaGalaxyZoo项目通过哈勃发现了一个三重星系合并下面这张图片中的大量尘埃和明亮的恒星漩涡是遥远的合并星系IC2431,它位于距地球6。81亿光年的巨蟹座。NASAESA哈勃太空望远镜捕捉到了似乎是一个正在进行中的三重星系合并以及印度再禁50款中国手机应用腾讯加速器和美颜相机在列包括腾讯公司的Xriver和网易的OnmyojiArena在内,印度计划禁止50款中国相关的应用程序。在过去一年半时间里,印度当局不断以国家安全为由禁止中国开发商的游戏和应用。本次新报告显示AMDRadeon和NVIDIAGeForce显卡售价回落根据3DCenter公布的最新售价和供货报告,2022年1月,AMDRadeon和NVIDIAGeForce显卡的价格有了明显的改善,而且普通用户也更容易买到这些显卡了。根据3DCWin11新功能界面曝光要给你的电脑打分了尽管当前Windows11系统并未自带打分功能,不过,爆料人Albacore曝光的系统界面显示,微软正添加名为ldquo可持续性rdquo的功能,其中包括一组由5朵树叶组成的评分体全年营收超千亿!联发科2021年财报出炉日赚6767万元1月27日消息,今日,联发科发布2021年第四季度及2021年全年财务报告。报告显示,联发科去年合并营收达4934。15亿元新台币(约合1128亿元人民币),年增53。2,创历史新中国汽车征服欧洲日韩美国市场只是时间问题。该解决方案并非至供给哪吒一家,还会提供给其他座智能网联车的车厂。ldquo如果仔细分一下,在车联网的安全漏洞特别多,因为整个车子这个行业它网约车开始加收春节服务费平台称全额给司机分文不取春节临近,回乡的身影越来越密集。最近打车的你,又没有发现要多收一笔钱了?经查,部分网约车平台已经发出通知,开始收取春节服务费。以美团打车为例,面向上海用户的收费标准是,1月27日至