教育房产时事环球科技商业
投稿投诉
商业财经
热点动态
科技数码
软件应用
国际环球
晨报科学
新闻时事
信息智能
汽车房产
办公手机
教育体育
生活生物

揭秘搜狗全球首个手语AI合成主播幕后

  搜狗近日发布了最新一代AI合成主播——全球首个手语AI合成主播“小聪”,从技术上给听障人士获取信息、更好融入社会提供了一种新帮助。
  根据世界卫生组织发布的最新数据显示,全球有约4.66亿人有听力障碍,在我国听障人员有2700万人。由于受教育程度参差不齐,除了文字,手语仍是听障人士的第一语言。
  手语AI合成主播“小聪”是基于搜狗人工智能和AI分身技术打造的“数字人”,以打造聋人真正可懂的通用手语播报为目标。“小聪”集成了3D数字人建模、机器翻译、多模态数字人生成、迁移学习、实时面部动作生成及驱动等多项AI技术。在组织的聋人可懂度测评中,“小聪”的手语播报可懂度可以达到85%以上。
  手语AI主播创意源于一次网友交流
  谈及搜狗打造全球首个手语AI合成主播的初衷,搜狗AI交互技术部总经理陈伟回忆道,2019年的时候看到微博上有一位聋人朋友吐槽自己的搜狗语音没法正常用,无法和朋友交流。在通过私信沟通帮他解决问题后,我们意识到其实听障群体对信息获取这件事情特别有期待。如何更好的用搜狗的技术帮助听障人群获取信息,此后我们开始思考并行动。
  事实上,搜狗在AI合成主播领域已深耕多年。从2018年首次推出AI合成主播到现在,搜狗“数字人”技术已经进行了多次迭代进化。
  但是,和有声语言不同,手语是一种视觉空间语言,以表形表意为主,是通过手势、表情、唇动、姿态等方式来表达的。这也意味着手语拥有自身独特的表达逻辑和特点,比如手语表形度高、词性结构不发达、语序语法结构独立等等。
  详细来说,手语的语序,跟汉语语序表达不一样的地方;在词汇方面,手语里没有虚词,没有量词;手语里特有的非手控的信息,比如说表情、口动、身体的朝向这部分在语音语言里是没有的。
  相比较搜狗此前推出的数字人语音主播,手语主播“小聪”背后又有哪些技术思考和突破呢?
  手语AI主播的“超”能力
  “如何把手语语言体系进行计算机应用转化,这件事此前业内并没有特别明确的做法。”,陈伟分析认为,要做出真正让聋人可懂的手语“数字人”,需要解决三个问题:一是,完成手语语言向计算机语言转化。二是,实现健听人和聋人两种语言之间高效高质量转换。三是,驱动“数字人”做出逼真的自然连贯的手语动作和面部表情。
  在明确了要解决的问题后,搜狗技术产品团队开始有针对性的逐一突破。
  陈伟称,要解决上面三个问题,第一需要把手语词汇转化成文字或技术方式标注出来;第二需要构建健听人语序和聋人之间语序之间的平行语料对,这需要大量的机器翻译库;第三需要通过捕捉的方式,预先捕捉大量的真人动作和表情数据,这些数据用来做模型训练。
  另外,陈伟强调,此前搜狗做3D AI合成主播时一直强调唇形,最多加上表情。手语AI合成主播还需要加入更多新的维度,比如主播的嘴形、表情、姿态、手部动作一定要保证在同一时间完成。如果嘴形或动作有提前或滞后情况,这样给人的感觉就是表达不够准确。所以技术上要做到充分对齐,通过多模态端到端生成模型进行联合建模及预测,生成高准确率的动作、表情、唇动等序列。
  针对手语AI主播项目,搜狗除了内部组建了语言、产品和研发体系外,还专门设置了一个“顾问团”。
  据说,顾问团由三类型人员组成,一部分是国家官方聋协和残联标准部门专家;一部分是手语学校的老师,能够听懂声音,同时也能打好手语,做手语教学的人;第三部分是手语的使用者,也就是聋人。通过把手语语言专家、工程师、研究员、实际用户集中在一起,持续沟通、产品迭代,最终打造出全球首个手语AI合成主播“小聪”。
  现在,在数字人效果方面,“小聪”使用了3D重光照扫描还原、面部肌肉驱动、表情肢体手势捕捉技术,生产出了高度还原真人发肤、形象逼真、动作自然生动的数字人模型,手语播报的真实感与亲切感大幅提升。
  手语表达方面,“小聪”能够实现健听人语言与听障者手语语言的机器翻译能力,基于输入的健听人语言能够低延迟生成高准确率的手语语言表征,快速生成数字人手语播报视频,达成信息有效传递。
  手语展现方面,“小聪”可以完整实现手控信息及非手控信息的表达,手语表征信息,覆盖手部动作、面部表情、口动唇动等多个维度,达到自然、地道、接受度更高的手语表达效果。
  自2018年发布全球首个AI合成主播至今,搜狗的“数字人”已经广泛应用于广电、媒体、金融、证券、保险、司法、教育、气象等诸多领域。陈伟透露,搜狗手语AI合成主播预计今年年底将实现大规模应用。
  【来源:Techweb】【作者:果青】

macOS端OneDrive即将升级可在M1Mac设备上原生运行微软宣布将会对macOS端的OneDrive应用进行升级,使其能够原生支持2021年之后发布的苹果M1Mac设备,同时还计划引入其他性能改进。微软计划在今年晚些时候更新OneDriiHour新版登场首次兼容iPad全新小项目知名时间管理应用ldquoiHourmiddot时间投资计划rdquo刚刚推出2021年度的最大一次升级改进,新版首次兼容iPad设备,并对大屏上的运行表现进行了特别优化。全新ldCHIME望远镜探测到500多个来自外太空的神秘快速射电暴麻省理工学院的研究人员报告说,大型射电望远镜CHIME在其运行的第一年就探测到500多个神秘的快速射电暴。在其运行的第一年的观测结果使已知的射电暴数量翻了两番,并揭示了两种类型一次神州租车被强制收购股票预计7月8日退市在国内的租车市场中,神州租车和一嗨租车无疑是两大巨头。但是,受瑞幸咖啡财务作假的牵连,神州租车也被迅速带来下神坛。而今,神州租车的股权(神州优车)出售之路也终于迎来了大结局。神州租华为更新HarmonyOS2升级名单大量荣耀机型加入既然是史上规模最大的一次升级,荣耀怎能不再列。尽管发布会上公布的名单中没有荣耀机型,但HarmonyOS官微刚刚更新,大量荣耀经典机型在列。具体来说,荣耀30系列V30系列20系列官宣虚幻引擎5将于26日晚开启抢先体验去年5月首次公布并演示基于PS5的实机画面后,Epic宣布,虚幻引擎5将在北京时间5月26日(周三)晚22点开启抢先体验计划。虚幻引擎5专为次世代主机PS5XboxSeriesX以Win1021H1正式版推送后出问题微软火速出手解决Windows102021年5月更新即版本21H1在本周早些时候发布,同时供用户通过WindowsUpdate及直接通过ISO文件进行安装。随后,微软发布了Windows1021H确认Win105月更新出问题升级后无法登陆自家应用微软已经推出了Windows105月更新的正式版,你是否发现问题了呢?据外媒最新报道称,微软已经确认了Windows105月更新的问题,比较尴尬的是,部分用户反馈称安装五月累积更新微软2022年6月15日彻底结束IE浏览器使命在超过25年后,微软终于要在明年退役IE浏览器(InternetExplorer)。多年来,这款老化的网络浏览器基本上没有太多消费者使用,微软决定在2022年6月15日把最后一颗钉四部门2023年汽车可回收利用率达到95日前,我们从工业和信息化部官方微信平台工信微报了解到,工信部科技部财政部商务部四部门近日印发关于印发汽车产品生产者责任延伸试点实施方案的通知。该通知以生产企业为主体,充分发挥汽车生联想集团财年净利润80亿人民币同比增长705月27日,联想集团公布截至2021年3月31日的202021财年第四财季及全年业绩全年整体营业额在一年内飙升近700亿人民币,同比增长19。8,达到4116亿人民币的新里程碑税前
芯片制造商和电子制造商无法找到足够的技术工人据外媒Techspot报道,从原材料到芯片和其他基本部件的短缺正在对电子和汽车行业产生连锁反应,但这仅仅是开始。北美亚洲和欧洲的供应商现在正面临着一个更大的问题在需求比多年前更高的Netgear发布固件更新公告受CircleRCE安全漏洞影响Netgear刚刚发布了一份安全公告,提供旗下十余款路由器的用户们尽快更新固件。受一个可被攻击者利用来远程执行代码的安全漏洞的影响,你甚至会在不使用相关软件的情况下成为受害者。具体刀法精湛推特爆料人分享英伟达RTX30SUPER系列显卡规格早前有消息称,英伟达或于明年初的CES2022消费电子展上发布GeForceRTX30SUPER系列显卡新品。现在,Kopite7kimi又在Twitter上披露了RTX30SUPEquipmake推出JewelE号称世界上续航里程最长的电动双层巴士据外媒NewAtlas报道,英国Equipmake公司和西班牙巴士制造商Beulas周三宣布合作推出JewelE电动巴士。Equipmake称这款电动巴士拥有世界上所有电动双层巴士ThomBrowne版GalaxyWatch4Classic本月29日发售在近期的Unpacked活动中在推出GalaxyZFold3ZFlip3等新品之外,三星还宣布继续和ThomBrowne合作推出限量版定制。今天,三星宣布ThomBrowneEdiB站投资SEngine鹰集咖啡,后者为精品咖啡连锁品牌企查查APP显示,上海东磨实业有限公司发生工商变更,新增B站关联公司上海哔哩哔哩科技有限公司为股东,同时公司注册资本由718。48万元人民币增加至814。28万元人民币,增幅为13苹果故意泄漏?iPhone13官方保护壳曝光外形抢先看这发布会马上开始,不过有网友发现,苹果官网似乎提前泄漏了iPhone13的信息。从放出的细节看,社交网络上出现了疑似为iPhone13硅胶保护壳和真皮保护壳的照片。适用于iPhon提高产业集中度!工信部鼓励新能源汽车企业兼并重组9月13日消息,今日,工信部部长肖亚庆在国新办发布会上表示,下一步,新能源汽车企业要做大做强。现在新能源汽车企业数量太多,处于小而散的状况。要充分发挥市场作用,鼓励企业兼并重组做大麒麟960经典重生!Mate9P10等本月下旬内测鸿蒙HarmonyOS6月2日,HarmonyOS2。0鸿蒙系统正式发布的时候,华为公布了升级机型名单,覆盖上百款之多,四五年前的老旗舰Mate9系列P10系列也赫然在列!它们的升级时间原本定在明年上半麒麟芯片绝版华为任正非谈海思未来去爬喜马拉雅山如果没有限制,今年9月份华为海思半导体就要推出新一代麒麟处理器了,传闻会首发ARMv9架构,很好很强大,只是现在华为能设计出来,短时间内也造不出来了。那华为的海思半导体部门未来要如Uber优步已支持在地图中搜索表情9月23日消息UberEats(优食)近日添加了一项新功能,允许用户在地图中搜索表情。比如输入汉堡emoji,就可以查找到附近的汉堡店。据了解到,该功能已面向所有用户推出,官方表示