hmm是什么意思(hmmm的英语发音)
最近笔者在追一部"老剧"——《法证先锋》,这部戏里面展示了各种高端的刑侦技术,有时候感觉进入了实验室。
最近剧中就展示了一种声纹识别技术。在生物界的声音识别的应用早已存在,但就像Ironman语音控制自己的战衣一样,电子产品是如何利用声纹信息工作的呢?
1 什么是声纹呢?
正所谓"闻声知人",可见我们通过听觉来判断说话人的身份,古已有之。
说到声纹,大家肯定会想到指纹。与指纹的唯一性类似,每个人在说话过程中所蕴含的个性特征(如发音习惯)几乎是独一无二的,就算被模仿,也改变不了说话者最本质的特性(尤其在成年之后,可以在相当长的时间里保持相对稳定不变)。
声纹可以理解为是一种行为特征,由于每个人在讲话时使用的发声部位如舌头、牙齿、口腔、声带、肺、鼻腔等在尺寸和形态方面有所差异,以及年龄、性格、语言习惯等多种原因,在发音时千姿百态,因而导致这些部位发出的声音必然有着各自的特点。因此任何两个人的声纹图谱都不尽相同。
2 声纹识别系统的发展
声纹识别系统的开发进展主要包括在声纹确认领域的开发进展和声纹辨认领域的开发进展。
在声纹确认领域,1998年,声纹识别技术被欧洲电信联盟用在电信与金融结合的领域中。2004年,美国Beep Card公司发明了一种可以识别卡主人声纹信息的信用卡,用于确认信用卡使用者的身份。2006年,美国Voice Vault开发的声纹识别系统被用在荷兰的一家银行中,用于身份验证。2011年,中国建设银行与国内声纹识别技术最有名的得意公司合作,开发出了一款声纹电话银行系统,2013年,中国天聪公司与厦门公安局合作,搭建"报警声纹采集系统"。近些年,声纹识别技术主要用在网上交易中远程身份验证、手机用户验证解锁。
在声纹辨认领域的发展与声纹确认领域相比慢了很多,它主要被用在公安、司法以及军事国防中,因其涉及领域的敏感性,很少有系统研究进展被披露出来。
3 声纹的相关理论研究
声纹识别技术理论的发展主要包括在特征提取方面的理论发展与在模型建立方面的理论发展。
在特征提取方面,最早被用于声纹识别技术的是语谱图特征,科学家们通过肉眼观察完成语谱图特征的匹配,这种方法耗时耗力,且准确性不高。
摘自2010年国际万维网会议论文
International Conference on World Wide Web. 2010
语谱图
1969年Luck首次研究出语音的LPCC 即Linear Predictive Cepstral Coefficient(线性预测倒谱系数)特征,并将该特征用于声纹识别技术,提高了识别的准确度,取得了很好的效果。后来的学者提出了将基频特征作为LPCC特征的补充用于声纹识别,将系统识别准确率提高到一个不错的水平,掀起了对语音信号倒谱特征的研究热潮。在不久之后,PLP (Perceptual Linear Prediction)特征、LSPC(Line SpectrumPair)谱系数特征、MFCC(Mel Frequency Cepstrum Coefficient)特征都被研究出来,并对声纹识别技术的发展注入了更多的活力。
在模型建立方面,最早被用于声纹识别技术的是模板匹配算法,它开启了用模式匹配的方式开展声纹识别技术研究的先河;在它之后,DTW (Dynamic Time Warping,动态时间规划)、HMM(Hidden Markov Model,隐马尔科夫模型)、VQ( Vector Quantization,矢量量化)等也被相继研究出来,都取得了不错的效果。
20世纪90年代后期,Reynods提出用GMM作为声纹识别技术的模型,一经提出,GMM(C Generalized Method Of Moments,高斯混合模型)就因其识别准确率高、操作简单、鲁棒性强而被业界广泛应用,时至今日,该技术仍然活跃在声纹识别技术领域中。
2000年,Reynod提出用GMM-UBM模型(Generalized Method Of Moments一Universal Background Model,高斯混合模型和通用背景模型)弥补GMM模型对样本需求大的不足,为声纹识别技术真正走向商用做出了很大的贡献;进入到21世纪后,JFA(Joint Factor Analysis,联合因子分析)和i-vector模型被用到声纹识别技术中,克服了GMM-UBM模型中高斯分量必须相互独立的局限性。近年来,深度学习开始被用于声纹识别技术中,并取得了不错的效果。
4 LPC(线性预测)算法
纵向看,声纹识别系统有两个主要部分构成,一个部分是特征提取,另一个部分是模式识别。
LPC(线性预测)是非常有用的语音信号特征提取方法中的一种,其实质是:时域语音采样点之间存在关联性,某一语音信号当前的值可以使用以前的很多个语音信号采样值的加权线性拼合进行模拟,这个加权系数就是线性预测。
先计算时域语音的样点值和线性预测取样样点值的差,后取其二次方和,再用其最小值确定仅有的一个预测系数向量。
令时域语音数据的采样值序列为S(n) , n = 1, 2, 3, ... m,这里的S(n)代表时域语音采样的当前值,即在第n时刻的采样值的大小。依据以前q个取样值的加权之和来估算当前的取样值S(n)称作是q阶线性预测。预测值为:
其中加权系数aj表示预测系数。语音取样值和自身的线性预测值之间的差值被称作是预测误差,用e(n)表示为:
其中,预测误差e(n)能被看成是S(n)经过下面传输函数的输出:
A(Z)即LPC的误差滤波器,设计它就是求解预测系数aj,使预测系数e(n)在某个准则下最小,此过程称为LPC分析。
线性预测的实质为得到一个预测系数向量a1, a2, ... aq,就是语音信号生成模型的系统函数H (z)的参数,满足预测误差e(n)在特定情况下最小。
这里的特定情况通常指均方误差
取最小值,表示先取误差的平方再取平均值。
线性预测系数可以反映说话者简化后的发音特征,即声道特征。其流程图如下:
最后祝愿声纹技术在AI的土壤里蓬勃发展,希望可以在特长的领域里发挥独特的作用。
参考资料:
维基百科
知乎
声纹识别中语音特征参数提取
面向会议场景的声纹识别技术研究与系统实现
https://twitter.com/AkiyoshiKitaoka
https://www.reddit.com/r/pics/comments/px2j3/made_a_gif_of_the_munkerwhite_illusion_for_class/
https://twitter.com/NovickProf/status/1139342022551191553
https://www.youtube.com/watch?v=nTOTmED9EzU
来源:中科院半导体所
编辑:Dannis
↓ 点击标题即可查看 ↓
1. 物理定律告诉你:表白可能巨亏,分手一定血赚
2. 震惊!昨天你们立起来的扫把,甚至真的惊动了 NASA
3. 酒精和 84 消毒液到底能不能一块用?
4. 一次性医用口罩是怎么做出来的?如何消毒?
5. 数学好玩个球啊,这支豪门球队用一群数理博士横扫球场
6. 「测温枪」到底是怎样测出你的温度的?
7. 等量 0 度水和 100 度水混合能得到 50 度水吗?
8. 人类为什么喜欢亲吻?
9. 病毒从哪里来?
10. 一见钟情,到底靠不靠谱?
好看小说(十大经典好看小说)好看小说(十大经典好看小说)最近在书旗小说看了好多小说,都是免费阅读,为此还在清明假期间差不多通宵了两次,让人又想到了曾经看小说的时光。尤其是那些让人曾经通宵看过的仙侠小说,至今想
好看小说(十大经典好看小说)好看小说(十大经典好看小说)最近在书旗小说看了好多小说,都是免费阅读,为此还在清明假期间差不多通宵了两次,让人又想到了曾经看小说的时光。尤其是那些让人曾经通宵看过的仙侠小说,至今想
清穿文推荐(6本清穿类型的小说推荐)清穿文推荐(6本清穿类型的小说推荐)第一本本文无cp,女主穿成一个嫡小姐信重的大丫鬟,好不容易在府中站稳脚了,谁知道嫡小姐嫁入宫中成了皇后,连带着她也跟着进宫,于是立志做好凤仪女官
清穿推荐(3本好看的清穿文)清穿推荐(3本好看的清穿文)本期分享3本好看的清穿文,炮灰只想当米虫,不经意成为了四爷的宠妾!一清穿之四爷宠妃作者雪中回眸简介李絮是小白花?不是。那就是聪明伶俐会宫斗?也不是。圣母
清穿小说推荐(5本清穿苏爽小甜文)清穿小说推荐(5本清穿苏爽小甜文)今天又是新的一天,小编今天给大家推荐5本清穿苏爽小甜文,穿越时光,回到大清,演绎一场清穿爱恋目录1。清穿之媚宠入骨作者李诗情2。清穿之媚君心作者李
近年来经典好看的网络小说分享(12本经典好看的网络小说)近年来经典好看的网络小说分享(12本经典好看的网络小说)现在的网络小说,只怕得有几千万部了,从这么多的网络小说中找出自己喜欢的,就如同大海捞针,还真是不容易。笔者就根据自己的阅读经
比较好看的小说(4本非常耐看的小说)比较好看的小说(4本非常耐看的小说)大家好,我是爽哥,本期分享4本名气不是很大但是却非常耐看的小说,晚上别看,怕你忍不住熬夜通宵!第一本城管无敌作者老老王本书字数280。6万字书评
青春校园小说(10本藏在课桌下面的校园小说)青春校园小说(10本藏在课桌下面的校园小说)还记得那些年藏在课桌下面的小说吗?还记得当年那又爱又怕又紧张又激动的心情吗?在那个被杜绝早恋的日子,我们喜欢的第一个男生应该是小说中的男
快穿是什么意思(慢穿是什么意思)以身许祖国快穿时代奇缘女强爽文简介钟蕾绑定女配虐渣系统,穿梭各个小世界,手撕渣男,碾压极品。然而时间久了,这种打打杀杀的日子,实在无聊且没有价值。她总觉得,自己心中还有更重要的信仰
校园爱情电影(超好看的青春校园电影)校园爱情电影(超好看的青春校园电影)毕业之后,我们面临各种工作压力,那时的爱情是很现实的,所以我们开始怀恋起我们校园时代纯纯爱恋,那时候的爱情是青涩的,也是纯粹的。匆匆那年匆匆那年
已完结的玄幻小说(经典玄幻小说100部)沧元图作者我吃西红柿我叫孟川,今年十五岁,是东宁府镜湖道院的当代大师兄。全球武道称尊作者蒲桥老三苏阳能量点62资质E(92100)气血40精神18200年前,灵气复苏,武道崛起,地
警方称曾春亮案办案民警有瑕疵近日有关于警方称曾春亮案办案民警有瑕疵的问题受到了很多网友们的关注,大多数网友都想要知道警方称曾春亮案办案民警有瑕疵的具体情况,那么关于到警方称曾春亮案办案民警有瑕疵的相关信息,小
全球冰川湖面积不到30年增加了51近日全球冰川湖面积不到30年增加了51登录了热搜,也是在网上引起了网友们的关注,那么很多小伙伴可能还不清楚具体的情况如何,小编也是在网上查阅了一些信息,那么接下来就分享给大家来了解
跑男哪里看(奔跑吧第八季芒果TV)在最新一季奔跑吧,有一片段是奔跑吧兄弟结婚镜头。除了有杨颖关晓彤当新娘外,节目组还邀请了四位女嘉宾,分别是李潇潇陈奕雯李丰秀以及铁豆。其中,郑恺的新娘李潇潇,其实曾上过新相亲大会笑
愉妃为什么变坏(如懿传愉妃)此女是如懿传里的海兰,清宫戏中小燕子的婆婆,她差点成为太后文萧梦最近读了未播先红的清宫戏如懿传中的故事简介,大概的了解了里面的故事情节,这是一部以乾隆帝的继后乌拉那拉氏为主的后宫戏
盗墓笔记演员表(盗墓笔记2演员表)盗墓笔记演员表(盗墓笔记2演员表)在盗墓笔记前传老九门中,有张大佛爷换血的一件事,而和张大佛爷换血的人就是张家人。起因是在长沙火车站突然出现一列铁皮火车,张启山后来根据里面的线索找
死囚乐园第二季(死囚乐园小白为什么杀全班)死囚乐园第二季(死囚乐园小白为什么杀全班)想玩游戏吗?诸位!代价是死亡的那种!我反正是不敢的!也只有日漫才会有这么多脑洞之作,真不知道作者是怎么想的?还是说作者本身具有暴力倾向,不
刀剑神域为什么被禁(刀剑神域为什么没有第二季)绅士君的AE86已发动,点击上方头像我们加入绅士大军,绅士君带你们漂移秋名山!在2015年3月31日的时候,大家应该都收到了一个消息,那就是包括刀剑神域第一季和第二季在内的数十部动
新闻编辑室为什么被砍(新闻编辑室第二季)小时候,我们看好莱坞大片,看超级英雄漫画,也是这么觉得的,但凡地球发生了什么危机,人类出现了什么灾难,拯救世界的,必然是美国人,超人,是美国人,蝙蝠侠,是美国人,钢铁侠,是美国人,
如何改图片尺寸(怎么用画图将照片调整为2寸)最近小编接收到小伙伴很多有关修改照片尺寸的问题,怎么将手里不同尺寸的照片修改成上传平台的尺寸要求,着实难住了一大圈的小伙伴。那怎么更改相片尺寸大小呢?今天,小编给大家安利一款图片在
真赤龙神帝(exe世界邪神百科)真赤龙神帝(exe世界邪神百科)很多冒险格斗主题的动漫里,都有实力不相上下的绝顶高手,他们之间的强强对抗,经常能成为漫迷们的谈资。比如史上最强弟子兼一里打架100段的逆鬼至绪与人越
广告在哪里(街上的广告词有哪些)作者六邦客授权发布9月24日,中国(北京)自由贸易试验区正式揭牌成立。一周之后,北京市城市管理委会同市商务局拟定了北京市商业街区店铺招牌设置规范(试行),面向社会公开征求意见。依征