hmm是什么意思(hmmm的英语发音)
最近笔者在追一部"老剧"——《法证先锋》,这部戏里面展示了各种高端的刑侦技术,有时候感觉进入了实验室。
最近剧中就展示了一种声纹识别技术。在生物界的声音识别的应用早已存在,但就像Ironman语音控制自己的战衣一样,电子产品是如何利用声纹信息工作的呢?
1 什么是声纹呢?
正所谓"闻声知人",可见我们通过听觉来判断说话人的身份,古已有之。
说到声纹,大家肯定会想到指纹。与指纹的唯一性类似,每个人在说话过程中所蕴含的个性特征(如发音习惯)几乎是独一无二的,就算被模仿,也改变不了说话者最本质的特性(尤其在成年之后,可以在相当长的时间里保持相对稳定不变)。
声纹可以理解为是一种行为特征,由于每个人在讲话时使用的发声部位如舌头、牙齿、口腔、声带、肺、鼻腔等在尺寸和形态方面有所差异,以及年龄、性格、语言习惯等多种原因,在发音时千姿百态,因而导致这些部位发出的声音必然有着各自的特点。因此任何两个人的声纹图谱都不尽相同。
2 声纹识别系统的发展
声纹识别系统的开发进展主要包括在声纹确认领域的开发进展和声纹辨认领域的开发进展。
在声纹确认领域,1998年,声纹识别技术被欧洲电信联盟用在电信与金融结合的领域中。2004年,美国Beep Card公司发明了一种可以识别卡主人声纹信息的信用卡,用于确认信用卡使用者的身份。2006年,美国Voice Vault开发的声纹识别系统被用在荷兰的一家银行中,用于身份验证。2011年,中国建设银行与国内声纹识别技术最有名的得意公司合作,开发出了一款声纹电话银行系统,2013年,中国天聪公司与厦门公安局合作,搭建"报警声纹采集系统"。近些年,声纹识别技术主要用在网上交易中远程身份验证、手机用户验证解锁。
在声纹辨认领域的发展与声纹确认领域相比慢了很多,它主要被用在公安、司法以及军事国防中,因其涉及领域的敏感性,很少有系统研究进展被披露出来。
3 声纹的相关理论研究
声纹识别技术理论的发展主要包括在特征提取方面的理论发展与在模型建立方面的理论发展。
在特征提取方面,最早被用于声纹识别技术的是语谱图特征,科学家们通过肉眼观察完成语谱图特征的匹配,这种方法耗时耗力,且准确性不高。
摘自2010年国际万维网会议论文
International Conference on World Wide Web. 2010
语谱图
1969年Luck首次研究出语音的LPCC 即Linear Predictive Cepstral Coefficient(线性预测倒谱系数)特征,并将该特征用于声纹识别技术,提高了识别的准确度,取得了很好的效果。后来的学者提出了将基频特征作为LPCC特征的补充用于声纹识别,将系统识别准确率提高到一个不错的水平,掀起了对语音信号倒谱特征的研究热潮。在不久之后,PLP (Perceptual Linear Prediction)特征、LSPC(Line SpectrumPair)谱系数特征、MFCC(Mel Frequency Cepstrum Coefficient)特征都被研究出来,并对声纹识别技术的发展注入了更多的活力。
在模型建立方面,最早被用于声纹识别技术的是模板匹配算法,它开启了用模式匹配的方式开展声纹识别技术研究的先河;在它之后,DTW (Dynamic Time Warping,动态时间规划)、HMM(Hidden Markov Model,隐马尔科夫模型)、VQ( Vector Quantization,矢量量化)等也被相继研究出来,都取得了不错的效果。
20世纪90年代后期,Reynods提出用GMM作为声纹识别技术的模型,一经提出,GMM(C Generalized Method Of Moments,高斯混合模型)就因其识别准确率高、操作简单、鲁棒性强而被业界广泛应用,时至今日,该技术仍然活跃在声纹识别技术领域中。
2000年,Reynod提出用GMM-UBM模型(Generalized Method Of Moments一Universal Background Model,高斯混合模型和通用背景模型)弥补GMM模型对样本需求大的不足,为声纹识别技术真正走向商用做出了很大的贡献;进入到21世纪后,JFA(Joint Factor Analysis,联合因子分析)和i-vector模型被用到声纹识别技术中,克服了GMM-UBM模型中高斯分量必须相互独立的局限性。近年来,深度学习开始被用于声纹识别技术中,并取得了不错的效果。
4 LPC(线性预测)算法
纵向看,声纹识别系统有两个主要部分构成,一个部分是特征提取,另一个部分是模式识别。
LPC(线性预测)是非常有用的语音信号特征提取方法中的一种,其实质是:时域语音采样点之间存在关联性,某一语音信号当前的值可以使用以前的很多个语音信号采样值的加权线性拼合进行模拟,这个加权系数就是线性预测。
先计算时域语音的样点值和线性预测取样样点值的差,后取其二次方和,再用其最小值确定仅有的一个预测系数向量。
令时域语音数据的采样值序列为S(n) , n = 1, 2, 3, ... m,这里的S(n)代表时域语音采样的当前值,即在第n时刻的采样值的大小。依据以前q个取样值的加权之和来估算当前的取样值S(n)称作是q阶线性预测。预测值为:
其中加权系数aj表示预测系数。语音取样值和自身的线性预测值之间的差值被称作是预测误差,用e(n)表示为:
其中,预测误差e(n)能被看成是S(n)经过下面传输函数的输出:
A(Z)即LPC的误差滤波器,设计它就是求解预测系数aj,使预测系数e(n)在某个准则下最小,此过程称为LPC分析。
线性预测的实质为得到一个预测系数向量a1, a2, ... aq,就是语音信号生成模型的系统函数H (z)的参数,满足预测误差e(n)在特定情况下最小。
这里的特定情况通常指均方误差
取最小值,表示先取误差的平方再取平均值。
线性预测系数可以反映说话者简化后的发音特征,即声道特征。其流程图如下:
最后祝愿声纹技术在AI的土壤里蓬勃发展,希望可以在特长的领域里发挥独特的作用。
参考资料:
维基百科
知乎
声纹识别中语音特征参数提取
面向会议场景的声纹识别技术研究与系统实现
https://twitter.com/AkiyoshiKitaoka
https://www.reddit.com/r/pics/comments/px2j3/made_a_gif_of_the_munkerwhite_illusion_for_class/
https://twitter.com/NovickProf/status/1139342022551191553
https://www.youtube.com/watch?v=nTOTmED9EzU
来源:中科院半导体所
编辑:Dannis
↓ 点击标题即可查看 ↓
1. 物理定律告诉你:表白可能巨亏,分手一定血赚
2. 震惊!昨天你们立起来的扫把,甚至真的惊动了 NASA
3. 酒精和 84 消毒液到底能不能一块用?
4. 一次性医用口罩是怎么做出来的?如何消毒?
5. 数学好玩个球啊,这支豪门球队用一群数理博士横扫球场
6. 「测温枪」到底是怎样测出你的温度的?
7. 等量 0 度水和 100 度水混合能得到 50 度水吗?
8. 人类为什么喜欢亲吻?
9. 病毒从哪里来?
10. 一见钟情,到底靠不靠谱?
床垫品牌哪个好(哪个牌子床垫质量最好)十大品牌排行榜专栏,是从品牌网(www。chinapp。com)网站延伸至官方公众号的特别栏目,专注了解更多行业品牌排行榜。十大品牌频道,这里的榜单都是由几十项数据统计计算系统自动
哪个牌子的水杯好(世界十大水杯品牌排行榜)本次推荐榜由优品牌网大数据系统提供数据支持,综合考虑了品牌的知名度企业资产规模与经营情况员工数量等多项指标。荣登2021年度富氢水杯行业热门品牌推荐榜如下2021年度富氢水杯热门品
挖机哪个牌子好(十大挖掘机品牌排行榜)1。小松(KOMATSU)著名的工程机械制造商,株式会社小松制作所成立于1921年,至今已有80年的历史,在工程机械领域有着先进的生产经验。于2001年2月在上海市注册小松(中国)
pptv电视机怎么样(康佳电视和pptv电视哪个好)来源中国网科技中国网科技8月6日讯继康佳小米等品牌下调小尺寸电视价格之后,5日,互联网电视品牌PPTV在官方微博也发布降价声明,从8月5日至18日,对部分型号产品进行价格调整。据悉
kktv电视怎么样(康佳kktv电视质量如何)孩子爱看电视苦恼?康佳KKTV护眼能学习的电视了解一下虽然现在的娱乐工具已经很丰富了,但电视机对于孩子而言还是拥有巨大的吸引力的,很多孩子放学回到家第一件事就是开电视机。其实这也能
康佳电视质量怎么样(康佳4k电视质量怎么样)OLED电视价格昂贵,一直是大家公认的,但是看了康佳这款早期上市的55寸OLED55V92U,可能大家瞬间觉得都买的起了,因为这款电视目前售价只需5888元。作为一款55寸OLED
创维海信tcl哪个好(康佳,创维,tcl电视哪个好)对于8090后来说,电视机绝对是儿时的快乐源泉。作为家庭生活中的一部分,不论我们入驻新宅,还是凭租房屋,家里肯定会有一台电视机。随着科技日益发展,生产电视机的企业变多了,电视机产品
康佳在哪里(康佳电视还在生产吗)文AI财经社程靓编辑杨洁你有多久没有看电视了?可还记得昔日家喻户晓的康佳电视?彩电巨头康佳的亏损仍在继续。10月27日,康佳公布了2021年第三季度报告。报告显示,第三季度公司营收
创维康佳哪个好(康佳,创维,tcl电视哪个好)当下跌已成为彩电市场的主通道,对于众多主流彩电企业来说,则意味着新一轮的市场洗牌品牌重组大幕,已经徐徐拉开。本土传统彩电品牌阵营的洗牌,则已经接近尾声。孔余撰稿低迷了三四年的中国彩
直播软件哪个好(电视直播软件app)相信很多朋友都发现当贝市场里的直播软件都没有了。原本的电视直播板块也不见了,又碰上电视家下架,暂停服务,想看直播的朋友太难了突然我就在当贝市场的首页上看到一款软件有线电视。这是当贝
哪个直播软件好(电视直播软件app)现在的智能电视做的是越来越智能,功能也是越来越多,很多电视其实已经和手机没有什么区别了。可能很多朋友买了智能电视只会观看电视直播或者各种电影电视剧,并不知道智能电视有哪些好用的ap
要想工作自由创业就是自己的不二之选大学生毕业以后就是需要找到一份工作,因为我们找到一份工作才可以实现自己的价值,但是如果自己没有考上大学,是否就没有工作的机会呢?这是不可能的,因为我们尽管没有找到一份工作,也可以通
刚开始创业要让自己获得一个很好的学习技巧和方向用户在接触每一个事物的时候,尤其是在第1次接触的时候,都需要进行不断的了解和认识,看到了各个方面的具体情况,让自己可以实现一个更好的学习方式和学习方法,这样才可以实现对于这些事物的
女生创业难度远比男生要大但是也有自己的优势相信很多的人都不愿意自己出去打工,因为自己打工的时候创造的价值,最终还是被老板获取,我们自己虽然也能够获得工资,但是其实和我们自己的劳动付出是不成比例的,所以说很多的人还是非常的愿
什么绿植吸甲醛最好(除甲醛产品十大排名)1。银皇后首先第一个要说的就是银皇后了,它净化空气能力可是在绿植圈是出了名的,而且是还是遇强则强的选手,空气中污染浓度越高,就越能发挥它独有的净化功能,最适合通风条件不佳的阴暗房间
零食店为什么生意不好(实体店专门卖零食有生意吗)五一期间,三只松鼠开出68家联盟小店。截至5月1日,松鼠联盟小店累计开店371家。其中,有4家加盟商(联盟小店店主)开了加盟二店。在三只松鼠网上业绩说明会中,三只松鼠称,松鼠联盟小
2元店生意为什么不长久(小区门口开两元店可以吗)很久没写过东西了,3月的春天雨水特别多,一个月有20多天下雨,刚好今天有点时间,回答粉丝朋友们问的一些问题,问的最多的是2元的货源在那里进货。很多人都知道,开店位置很重要,但是找到
开什么店赚钱(十大冷门暴利生意)嗨大家好,我们又见面了,我是你们的老朋友农民大张。感谢大家一直以来对我的支持和鼓励,有了你们的支持和鼓励,我的写作之路才能走得更长远,我也才能为大家带来更多有用的好资讯。老规矩,今
创业网站可信吗(网上创业项目可信吗?怎么找可靠的项目?)创业网站可信吗(网上创业项目可信吗?怎么找可靠的项目?)随便到网上一查,就可以发现,网上创业项目非常多,而加盟创业项目更多,这些项目大多说前景好利润高回本快,吸引了很多的创业者前去
怎么样来钱快(适合穷人的18个创业项目投资小)随着农村青年的创业意识不断提升,交通和网络覆盖,让很多农村年轻人开始考虑返乡创业,所以一些种植养殖和加工项目,就成了很多人选择创业热门的方向。那么在农村创业想赚到的第一桶金,到底做
从这7个维度考虑创业想不成功都很难很多人说发展事业特别的困难,其实也不是想象中那么难的,只要你能够从多方面去加以细致的考虑,那么你在创业的时候成功的可能性依然是非常大的,总结起来的话大致就有7个维度,可能有的人觉得
创业没有资金怎么办(我想创业没钱没经验)在创业的问题上,大家都能知道,一定要有经济的头脑和适当的本钱,没有本钱是做不成的,那么穷人没本钱怎么创业?接下来,我们就来给大家讲解一下这方面的内容。1自媒体创业对于一个身无分文的