教育房产时事环球科技商业
投稿投诉
商业财经
热点动态
科技数码
软件应用
国际环球
晨报科学
新闻时事
信息智能
汽车房产
办公手机
教育体育
生活生物

微软语音合成技术升级编码器效果以假乱真

  微软日前发布新一代深度神经网络HiFiNet声码器,与微软上一代语音技术相比,由HiFiNet声码器合成的神经网络版声音质量再创新高,主要体现在发音更准确、韵律更自然、高保真效果更完美,更受客户青睐。自推出以来,被广泛应用到有声读物、在线教育、车载语音助手等领域。
  HiFiNet是 微软 神经网络版语音合成技术中最新的声音编码器,是决定音频质量的关键因素。根据行业公认的、专业评估语音自然度的MOS测试结果显示,由HiFiNet声码器合成的语音音质可与用于训练的真人录音样本相媲美,并同时改善毛刺、噪音等音频质量问题,输出的音质具备更高保真度,更大程度还原真人录音。
  与微软上一代声码器相比,微软HiFiNet声码器合成的音质更高(见演示视频第1、2段声音)。
  语音质量的优劣会直接影响收听者的感受,为提升用户收听的舒适度,在Azure语音合成系统中,神经网络声学模型基于深度学习网络,使用真人录音作为原始数据进行迭代训练。首先,提取真人录音的声学特征。然后,利用真人录音的声学特征自动生成两组音频:一组真实声波(原始录音)和一组伪波(合成声波)。最后,由鉴别器区分真实声波和伪波。随着训练次数的增多,声波生成器也会愈发“聪明”,直至生成鉴别器也无法区分的伪波,这意味着机器合成的声音已经和原始录音相差无几,从而给用户带来更贴近自然的体验。
  由微软HiFiNet声码器合成的音频质量更接近真人原始录音(见演示视频第3、4段声音)
  HiFiNet声码器训练示意图
  采样率越高,声音还原越真实。Azure神经网络版语音合成声学模型默认每秒钟采样24,000次 (24千赫兹),为还原特殊场景中更为复杂、细微的声音内容,HiFiNet声码器每秒钟采样48,000次(48千赫兹),满足用户对语音质量的严格要求,让用户尽享高清语音体验。
  音频采样频率与保真度对比示意图
  除语音质量外,HiFiNet合成速度较之其他模型也有显著的提升,进一步提升了语音合成的实时率。据RTF(Real Time Factor,实时率,用来测量语音合成速度的工具)测试结果显示,HiFiNet在GPU设备上运行的速度是第一代高性能声码器的3倍,在CPU设备上运行的速度是第一代高性能声码器的2倍。
  目前,内置HiFiNet声码器的Azure认知服务神经网络版语音合成服务已支持超过70多个国家和地区的语言,提供超过170个自然逼真的音色供开发者选择。
  欲了解有关HiFiNet及语音合成的更多内容,请点击:关于 HiFiNet 、关于语音合成 试用版 、 更多资料 以及 示例代码 。
  【来源:cnBeta.COM】

自研芯片骁龙8独此一款OPPOFindX5系列新版曝光去年上半年,OPPO推出了FindX3系列,随后在下半年推出了衍生机型FindX3Pro摄影师版。今年OPPOFindX5系列也将延续去年的策略,博主数码闲聊站爆料,OPPO今年下天玑90008000系列处理器大受欢迎联发科前5月营收大涨33今年上半年发布的智能手机中,越来越多的厂商都选择了联发科的新一代天玑平台,旗舰机中天玑9000分走了一杯羹,天玑8100及天玑8000又抢走了中端手机一块肉,推动联发科业绩大涨,前蝉联手游榜无压力王者荣耀5月全球吸金17。9亿元今天,数据统计机构SensorTower公布了今年5月份,全球移动游戏收入的Top10,王者荣耀毫无悬念的继续夺冠。在5月,王者荣耀全球吸金2。68亿美元(约合人民币17。9亿元)美国销量第一大皮卡入华福特F150猛禽价格公布6月20日消息,全新福特F150猛禽在国内的售价正式公布,为68。68万元。作为中期改款车型,新的F150猛禽在外观内饰等多个方面进行了升级,比如它使用了全新样式的前大灯L形日间行陶琳特斯拉全球交付量半壁江山来自上海工厂6月20日消息,昨日下午,由商务部和山东省人民政府共同主办的第三届跨国公司领导人青岛峰会开幕。据每日经济新闻报道,特斯拉公司全球副总裁陶琳表示,上海超级工厂正在持续成为特斯拉最重要抖音测试自动播放下一条视频功能彻底解放用户双手目前,抖音视频都是循环播放,只要用户不下滑,就会一直重复播放当前视频。而现在,抖音正在小范围测试ldquo自动播放下一个视频rdquo的功能,该功能可以让用户在刷短视频的时候,不再曝iPhone14将内置北斗导航芯片加入我国自主研发定位系统综合目前多方爆料,iPhone14系列会在今年9月份如期发布,将推出四款机型,目前在设计方面已经基本定型,零部件供应商将在下个月开始出货。据此前消息,iPhone14系列的亮点有无追赶台积电三星计划2025年量产基于GAA的2纳米芯片基于3纳米的全环绕栅极(GateAllAroundT,简称GAA)工艺有望成为半导体行业的游戏规则改变者。三星电子计划在未来三年内通过建立3纳米GAA工艺,赶上全球第一大代工公司台现代宣布与米其林扩大高端轮胎研发合作用于电动汽车等车型据国外媒体报道,在大力投资和发展电动汽车的现代汽车集团,已宣布将扩大同法国轮胎制造商米其林在高端轮胎研发方面的合作,用于现代即将推出的车型。从韩国媒体的报道来看,现代汽车集团是在当台积电计划在中国台湾再建4座工厂生产3纳米芯片据国外媒体报道,台积电计划在中国台湾省台南地区再建4座工厂,以生产3纳米芯片。据外媒报道称,这4座工厂每座工厂的造价约为100亿美元,据说都配备了生产3纳米芯片的生产线,生产的产品俄罗斯首款国产ATM机明年上市搭载自研芯片据俄罗斯新闻社报道,俄罗斯首款自研自动取款机(ATM)首批设备的交付时间定在了2023年23月。此消息由俄罗斯BFS公司首席执行官和共同所有人ArtemZhilonov共同宣布,据
中国移动2021年至2022年PC服务器集采开启共16个标包近日,中国移动采购与招标网发布2021年至2022年PC服务器集中采购(第1批次)招标公告。根据公告,中国移动本期集中采购产品为PC服务器,采购规模约为163692台。采用公开招标英特尔发布Q3财报营收增长净利润同比增长超过50据国外媒体报道,在特斯拉IBM等多家公司发布三季度的财报后,芯片巨头英特尔在当地时间周四也发布了三季度的财报,这一季度他们的净利润同比大幅增长,超过了50,远高于营收的同比增长率。性能提升多达88NVIDIA的DLSS已有120款游戏支持2018年NVIDIA推出RTX光追游戏技术的同时还带来了DLSS深度学习超级采样技术,前者提高了画质但会大幅降低性能,而DLSS被网友称为rdquo大力水手rdquo,因为它可以NVIDIA496。13版驱动发布正式放弃Win78。1系统NVIDIA刚刚发布了全新的GeForce496。13正式版显卡驱动,这也是R490系列的首个版本,不但在版本号上相比之前的R472系列有了飞跃,更新力度更是绝对重磅的。首先,它放PCIe5。0显卡供电接口首曝峰值功率600WRTX3090Ti首发如今高端显卡的功耗越来越高,88针PCIe辅助供电接口几乎已经是标配,888针在一些顶级非公卡上也很常见。日前有传闻称,NVIDIA将在明年一月发布新的顶级旗舰卡RTX3090Ti六边形战士出场!阿里推出顶级ARM服务器芯片倚天710在10月19日的阿里云栖大会上,阿里旗下半导体公司平头哥发布自研云芯片倚天710。这颗芯片一出场就技惊四座,成为目前业界性能最强的ARM服务器芯片。倚天710未来将用于阿里云数据中阿里巴巴发布自研倚天7105nm128核在正于杭州举办的云栖大会上,阿里巴巴平头哥发布自研CPU芯片倚天710。阿里表示,这是业界性能最强的ARM服务器芯片,性能超过业界标杆20,能效比提升50以上,未来将主要用于阿里云Win1021H2新版推送大量修复BUG!要谢幕了10月20日下午消息,微软刚刚推送了KB5006738补丁,面向ReleasePreview(发布预览)通道的Insider会员,Windows10操作系统安装后,版本号升级为BuArm发布物联网全面解决方案芯片开发节省2年时间ArmCortexA系列处理器在移动领域尤其是智能手机上无人不知无人不晓,但事实上,Arm的产品线相当丰富,还有针对微控制器的CortexM,面向实时处理的CortexR系列,尤其不止MacBookPro!苹果上架全新Magsafe数据线340元今天凌晨,苹果举行秋季第二场新品发布会,正式带来全新配色的HomePodminiAirPods3和以及新款ldquo刘海屏rdquoMacBookPro。新款MacBookPro提ClearviewAI有望为其面部识别技术获得一项美国专利根据Politico的报道,ClearviewAI有望为其面部识别技术获得一项美国专利。据报道,该公司收到了美国专利及商标局的ldquo许可通知rdquo,这意味着一旦它支付了所需