hmm是什么意思(hmmm的英语发音)
最近笔者在追一部"老剧"——《法证先锋》,这部戏里面展示了各种高端的刑侦技术,有时候感觉进入了实验室。
最近剧中就展示了一种声纹识别技术。在生物界的声音识别的应用早已存在,但就像Ironman语音控制自己的战衣一样,电子产品是如何利用声纹信息工作的呢?
1 什么是声纹呢?
正所谓"闻声知人",可见我们通过听觉来判断说话人的身份,古已有之。
说到声纹,大家肯定会想到指纹。与指纹的唯一性类似,每个人在说话过程中所蕴含的个性特征(如发音习惯)几乎是独一无二的,就算被模仿,也改变不了说话者最本质的特性(尤其在成年之后,可以在相当长的时间里保持相对稳定不变)。
声纹可以理解为是一种行为特征,由于每个人在讲话时使用的发声部位如舌头、牙齿、口腔、声带、肺、鼻腔等在尺寸和形态方面有所差异,以及年龄、性格、语言习惯等多种原因,在发音时千姿百态,因而导致这些部位发出的声音必然有着各自的特点。因此任何两个人的声纹图谱都不尽相同。
2 声纹识别系统的发展
声纹识别系统的开发进展主要包括在声纹确认领域的开发进展和声纹辨认领域的开发进展。
在声纹确认领域,1998年,声纹识别技术被欧洲电信联盟用在电信与金融结合的领域中。2004年,美国Beep Card公司发明了一种可以识别卡主人声纹信息的信用卡,用于确认信用卡使用者的身份。2006年,美国Voice Vault开发的声纹识别系统被用在荷兰的一家银行中,用于身份验证。2011年,中国建设银行与国内声纹识别技术最有名的得意公司合作,开发出了一款声纹电话银行系统,2013年,中国天聪公司与厦门公安局合作,搭建"报警声纹采集系统"。近些年,声纹识别技术主要用在网上交易中远程身份验证、手机用户验证解锁。
在声纹辨认领域的发展与声纹确认领域相比慢了很多,它主要被用在公安、司法以及军事国防中,因其涉及领域的敏感性,很少有系统研究进展被披露出来。
3 声纹的相关理论研究
声纹识别技术理论的发展主要包括在特征提取方面的理论发展与在模型建立方面的理论发展。
在特征提取方面,最早被用于声纹识别技术的是语谱图特征,科学家们通过肉眼观察完成语谱图特征的匹配,这种方法耗时耗力,且准确性不高。
摘自2010年国际万维网会议论文
International Conference on World Wide Web. 2010
语谱图
1969年Luck首次研究出语音的LPCC 即Linear Predictive Cepstral Coefficient(线性预测倒谱系数)特征,并将该特征用于声纹识别技术,提高了识别的准确度,取得了很好的效果。后来的学者提出了将基频特征作为LPCC特征的补充用于声纹识别,将系统识别准确率提高到一个不错的水平,掀起了对语音信号倒谱特征的研究热潮。在不久之后,PLP (Perceptual Linear Prediction)特征、LSPC(Line SpectrumPair)谱系数特征、MFCC(Mel Frequency Cepstrum Coefficient)特征都被研究出来,并对声纹识别技术的发展注入了更多的活力。
在模型建立方面,最早被用于声纹识别技术的是模板匹配算法,它开启了用模式匹配的方式开展声纹识别技术研究的先河;在它之后,DTW (Dynamic Time Warping,动态时间规划)、HMM(Hidden Markov Model,隐马尔科夫模型)、VQ( Vector Quantization,矢量量化)等也被相继研究出来,都取得了不错的效果。
20世纪90年代后期,Reynods提出用GMM作为声纹识别技术的模型,一经提出,GMM(C Generalized Method Of Moments,高斯混合模型)就因其识别准确率高、操作简单、鲁棒性强而被业界广泛应用,时至今日,该技术仍然活跃在声纹识别技术领域中。
2000年,Reynod提出用GMM-UBM模型(Generalized Method Of Moments一Universal Background Model,高斯混合模型和通用背景模型)弥补GMM模型对样本需求大的不足,为声纹识别技术真正走向商用做出了很大的贡献;进入到21世纪后,JFA(Joint Factor Analysis,联合因子分析)和i-vector模型被用到声纹识别技术中,克服了GMM-UBM模型中高斯分量必须相互独立的局限性。近年来,深度学习开始被用于声纹识别技术中,并取得了不错的效果。
4 LPC(线性预测)算法
纵向看,声纹识别系统有两个主要部分构成,一个部分是特征提取,另一个部分是模式识别。
LPC(线性预测)是非常有用的语音信号特征提取方法中的一种,其实质是:时域语音采样点之间存在关联性,某一语音信号当前的值可以使用以前的很多个语音信号采样值的加权线性拼合进行模拟,这个加权系数就是线性预测。
先计算时域语音的样点值和线性预测取样样点值的差,后取其二次方和,再用其最小值确定仅有的一个预测系数向量。
令时域语音数据的采样值序列为S(n) , n = 1, 2, 3, ... m,这里的S(n)代表时域语音采样的当前值,即在第n时刻的采样值的大小。依据以前q个取样值的加权之和来估算当前的取样值S(n)称作是q阶线性预测。预测值为:
其中加权系数aj表示预测系数。语音取样值和自身的线性预测值之间的差值被称作是预测误差,用e(n)表示为:
其中,预测误差e(n)能被看成是S(n)经过下面传输函数的输出:
A(Z)即LPC的误差滤波器,设计它就是求解预测系数aj,使预测系数e(n)在某个准则下最小,此过程称为LPC分析。
线性预测的实质为得到一个预测系数向量a1, a2, ... aq,就是语音信号生成模型的系统函数H (z)的参数,满足预测误差e(n)在特定情况下最小。
这里的特定情况通常指均方误差
取最小值,表示先取误差的平方再取平均值。
线性预测系数可以反映说话者简化后的发音特征,即声道特征。其流程图如下:
最后祝愿声纹技术在AI的土壤里蓬勃发展,希望可以在特长的领域里发挥独特的作用。
参考资料:
维基百科
知乎
声纹识别中语音特征参数提取
面向会议场景的声纹识别技术研究与系统实现
https://twitter.com/AkiyoshiKitaoka
https://www.reddit.com/r/pics/comments/px2j3/made_a_gif_of_the_munkerwhite_illusion_for_class/
https://twitter.com/NovickProf/status/1139342022551191553
https://www.youtube.com/watch?v=nTOTmED9EzU
来源:中科院半导体所
编辑:Dannis
↓ 点击标题即可查看 ↓
1. 物理定律告诉你:表白可能巨亏,分手一定血赚
2. 震惊!昨天你们立起来的扫把,甚至真的惊动了 NASA
3. 酒精和 84 消毒液到底能不能一块用?
4. 一次性医用口罩是怎么做出来的?如何消毒?
5. 数学好玩个球啊,这支豪门球队用一群数理博士横扫球场
6. 「测温枪」到底是怎样测出你的温度的?
7. 等量 0 度水和 100 度水混合能得到 50 度水吗?
8. 人类为什么喜欢亲吻?
9. 病毒从哪里来?
10. 一见钟情,到底靠不靠谱?
马二多少钱(马自达2价格及图片)大家好,面对如今行驶在马路上拥堵,且日常出行以中短途为主的用车场景,小型车反而才是最适合市区代步的选择。而除了飞度地位较为稳固以外,如雨燕以及早期雅力士均已退市,马自达在国内市场有
一贯钱是多少人民币(一个铜钱等于现在多少人民币)在小说水浒传中,最重要的一个情节便是智取生辰纲。全书以它为开头,掀起了好汉们轰轰烈烈上梁山的热潮。也正因为打劫了这批生辰纲,晁盖七人才没了退路,只能站在官府的对立面。晁盖等人剧照而
一块大洋值多少钱(一块真的袁大头值多少钱)北洋龙哪一年更贵?光绪元宝江南甲辰辛丑壬寅戊戌己亥等今日价值几何?斗泉为您带来2021年11月最新袁大头孙小头光绪元宝(龙洋)等银元的价格行情斗泉近期银元成交价袁大头三年天津版VR
崇宁通宝值多少钱(崇宁通宝的价格)崇宁通宝长宁扁头通仰通(二级)价值30005000元直径35。3mm厚度3mm描述钱文狭长缩示长宁扁头通仰通崇宁通宝长尾通扁通(三级)价值10002000元直径34。2mm厚度3。
康熙通宝一枚多少钱(嘉庆100万到150万古币图片)康熙通宝因为当时康熙所在位时政治和经济飞速的发展,让货币经济也特别的发达,所以当时铸造的康熙通宝都特别的精美,而且非常规整,钱币厚实重量足,铸刻的文字也特别的工整美观,每一枚都有着
多少克等于一两(克和俩的单位怎么换算)宋代以前的医学著作多为汉制,宋代以后的医学著作多为今制。参考资料班固。汉书律历志(郝万山视频摘录)一重量单位千二百黍重十二铢,两(铢)之为两,十六两为斤,三十斤为钧,四钧为石(sh
1斤等于多少两(单位换算表大全)一长度单位国际单位是米(符号m),最常见的有千米(km)米(m)分米(dm)厘米(cm)毫米(mm)。感性认识指甲厚一毫米,指甲长一厘米,手掌宽一分米,张开手臂长一米。1千米(km
一升水等于多少公斤(一升水是一千克吗)如今,随着汽车行业的发展,汽车渐渐地进入了人们的家庭中。有了车的人们自然也会开始关心油价,毕竟我们开车的时候都需要用到汽油。那大家既然都开了这么多年车,加了那么多次油了,有人知道这
面包蟹多少钱一斤(面包蟹一般多重一只)海鲜是一种特别好吃的食物,像小龙虾大闸蟹面包蟹波士顿龙虾大青蟹等等,各种都有,但是价格却很贵,一般土豪的话,才能够每天吃得起这样的海鲜,现在就连常见的龙虾都涨价了,卖到30元一斤,
椰子蟹多少钱一斤(椰子蟹最大的有多少斤)说起海鲜不得不提到螃蟹了,目前已知的螃蟹种类繁多,广泛分布在江河湖海及热带雨林等地方。你知道世界上最大的蟹是什么吗?世界上最大的蟹是生活在西北太平洋海底的杀人蟹,而世界上最大的陆生
暖气不热怎么办(家里暖气不热怎么办?)暖气不热怎么办(家里暖气不热怎么办?)冬天已经来临了,你的秋裤拿出来了吗?还有,11月份大部分地区就要开始征收暖气费了,相信很多小伙伴又会吐槽暖气费交了也白交,家里冷的还是像仓库。
壮阳的药有哪些(男士补肾壮阳药哪个效果好)当下,随着世界人口老龄化形势不断加剧,中老年男性健康问题,越发受到社会各界人士的重视。基于中老年男性的生理原因,机体各个器官功能都存在不同程度的退化。再加上心脑血管慢性病和亚健康状
店面管理(一份完整的门店管理实务)店面管理(一份完整的门店管理实务)为了创造一支以公司利益至高无上准则,建立高素质高水平的团队,更好地服务于每一位客户,公司制定了以下严格的管理规章制度,望各位员工配合遵守!一工作流
山西科技大学(山西科技大学录取分数线及专业)山西科技大学(山西科技大学录取分数线及专业)在山西有这么几所大学,本身都是双非大学,可是名气却一点都不小,在省内是赫赫有名,在国内也是小有名气,而且学生就业从不发愁,在当地是备受企
山东大学最好的专业(山东大学的王牌专业)山东大学最好的专业(山东大学的王牌专业)1双一流专业(数学与应用数学化学)2国家级特色专业28个,有针对性的说几个很好的专业(药学临床医学护理学电气工程及自动化材料成型及控制工程土
陕西理工大学怎么样(陕西理工大学厉害的专业)8月29日,伴着秋意迎着朝阳,来自全国各地的近500名2021年硕士研究生迈着笃定的步伐,满怀喜悦与憧憬走进陕西理工大学入学报到,正式开启承载着梦想与希望的研究生生涯。新生走进陕理
学西点哪个学校好(西点包括什么)西点学校哪个学校正规?学西点找正规的西点学校是必然的,如何选择一家正规的西点学校,对于很多西点初学者来说,都会考虑在内。正规西点学校01。正规的西点学校有办学资质,有自己的学校场地
会计学堂怎么样(会计学堂考证班怎么样)6月1日,在线会计实操培训品牌会计学堂宣布获得来自正保远程教育的数亿元战略投资,双方将在业务层面和资本层面进行全面战略合作。正保远程将向会计学堂注资数亿元,预期在4年内在全国布局1
会计学堂的课程怎么样(会计学堂正规吗)会计学堂着力打造会计行业口碑品牌会计学堂是一家什么企业,走的是品牌口碑之路吗?可以从这家企业的长远愿景看出端倪!会计学堂在多年高速发展下,给自己的定位是为2000万会计人的网上家园
尚学堂怎么样(考尚教育上班怎么样)我在尚学堂为期四个多月的培训结束了,才零星的面了几家企业,已经找到了一份薪资九千五的工作,在此简单的说一下自己没有基础学java的感想。刚来到尚学堂,也是第一次来北京这个充满神秘的
研究生是什么(研究生就是硕士吗)知己知彼,百战不殆!什么是研究生?小学初中高中(中专职高技校)大学(专科本科)研究生(硕士博士)以上是我国的五大学历等级,小学初中属于九年义务教育,现在已有少数地区实行了十二年义务
翻译怎么样(中国矿业大学翻译硕士难考吗)距离考研结束,已经过去了小半年的时间,心境渐渐恢复平静。回想自己考研之路,受到过学姐学长的不少帮助,自己也总结了一些考研经验和心得,因此想与学弟学妹一同分享,希望能够帮助到大家。1