[發(fā)明專利]一種基于自動(dòng)聲紋鑒定的聲紋識別方法和系統(tǒng)在審
| 申請?zhí)枺?/td> | 202111488987.2 | 申請日: | 2021-12-07 |
| 公開(公告)號: | CN114283815A | 公開(公告)日: | 2022-04-05 |
| 發(fā)明(設(shè)計(jì))人: | 張廣學(xué);肖龍?jiān)?/a>;李稀敏;葉志堅(jiān) | 申請(專利權(quán))人: | 廈門快商通科技股份有限公司 |
| 主分類號: | G10L17/02 | 分類號: | G10L17/02;G10L17/04;G10L17/18;G10L25/51 |
| 代理公司: | 廈門仕誠聯(lián)合知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 35227 | 代理人: | 蔡稷元 |
| 地址: | 361009 福建省廈門市集*** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 自動(dòng) 聲紋 鑒定 識別 方法 系統(tǒng) | ||
本發(fā)明涉及人工智能技術(shù)領(lǐng)域,具體涉及一種基于自動(dòng)聲紋鑒定的聲紋識別方法和系統(tǒng)。該方法包括:基于聲紋識別模型對獲取的待識別語音識別相應(yīng)的聲紋特征;識別的聲紋特征與聲紋庫進(jìn)行相似度比較,得到相似語音,并進(jìn)行聲紋特征相似度打分;通過自動(dòng)聲紋鑒定對所記錄共有的詞語語音片段進(jìn)行穩(wěn)定性特征和差異性特征提取并進(jìn)行自動(dòng)聲紋鑒定打分;對聲紋識別得分和自動(dòng)聲紋鑒定得分進(jìn)行權(quán)重求和,輸出最終得分。本發(fā)明借助于自動(dòng)聲紋鑒定技術(shù),有效提高聲紋識別的召回率和精準(zhǔn)率;對不同人的穩(wěn)定性特征和差異性特征進(jìn)行價(jià)值計(jì)算,有效避免同一個(gè)人相似度差別較大導(dǎo)致的漏識別,以及不同人因?yàn)橄嗨贫a(chǎn)生的誤識別的問題。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能技術(shù)領(lǐng)域,具體涉及一種基于自動(dòng)聲紋鑒定提高聲紋識別召回率和精準(zhǔn)率的聲紋識別方法和系統(tǒng)。
背景技術(shù)
隨著聲紋識別技術(shù)在公安、金融反欺詐、刑事偵查等方向的廣泛應(yīng)用,其應(yīng)用場景越來越多及相關(guān)技術(shù)指標(biāo)要求也越來越高。目前,聲紋識別技術(shù)有了很大發(fā)展,但是其聲紋驗(yàn)證的召回率和精準(zhǔn)率還有很大提升空間。現(xiàn)在的聲紋識別更多地依賴模型的表達(dá)能力和一些后端處理技術(shù),這部分主要依賴于模型提取的聲紋特征。但更多地依賴模型的表達(dá)能力,會(huì)有一定的不足之處:
首先,聲紋識別結(jié)果是聲紋特征之間的相似度。但是,不同時(shí)刻,提取同一個(gè)人的聲紋特征可能也會(huì)存在顯著的差異,導(dǎo)致同一個(gè)人聲紋相似度差別較大,排名靠后。
其次,人的聲紋有穩(wěn)定性特征和差異性特征,如何有效利用穩(wěn)定性特征區(qū)別不同的人,和使用差異性特征判定是同一個(gè)人,現(xiàn)有的聲紋識別模型表達(dá)能力還有待提高。
最后,現(xiàn)有的一些后端處理技術(shù)能在一定程度上提高聲紋模型的辨別能力,但是它最基礎(chǔ)的還是基于聲紋模型提取的聲紋特征。
發(fā)明內(nèi)容
針對上述問題,本發(fā)明實(shí)施例的目的在于提供了一種基于自動(dòng)聲紋鑒定技術(shù)的聲紋識別方法,以提高聲紋識別的召回率和精準(zhǔn)率。在聲紋識別技術(shù)基礎(chǔ)上進(jìn)行自動(dòng)聲紋鑒定技術(shù),則可以有效避免同一個(gè)人相似度差別較大導(dǎo)致的漏識別,以及不同人因?yàn)橄嗨贫a(chǎn)生的誤識別。
為實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例提供了如下的技術(shù)方案:
第一方面,在本發(fā)明提供的一個(gè)實(shí)施例中,提供了一種基于自動(dòng)聲紋鑒定的聲紋識別方法,包括以下步驟:
基于聲紋識別模型對獲取的待識別語音進(jìn)行聲紋識別,輸出得到相應(yīng)的聲紋特征;
遍歷聲紋庫,與輸出得到的聲紋特征進(jìn)行相似度比較,得到相似語音排序列表,并對聲紋特征相似度進(jìn)行打分,得到聲紋識別得分;
通過自動(dòng)聲紋鑒定對獲取的待識別語音以及得到的相似語音排序列表中的相似語音進(jìn)行語音音素識別,記錄共有的詞語語音片段;
遍歷語音音素,查找結(jié)構(gòu)相同的部分語音片段,通過自動(dòng)聲紋鑒定對所記錄語音片段進(jìn)行穩(wěn)定性特征和差異性特征提取,并對穩(wěn)定性特征相似度和差異性特征相似性度進(jìn)行打分,得到自動(dòng)聲紋鑒定得分;
對所述聲紋識別得分和所述自動(dòng)聲紋鑒定得分進(jìn)行權(quán)重求和,輸出最終得分。
在本發(fā)明提供的一些實(shí)施例中,所述聲紋庫中存儲有待比對語音,在將輸出得到的聲紋特征與聲紋庫中的聲紋特征進(jìn)行相似度比較時(shí),采用plda或cosine打分方式進(jìn)行比較。
在本發(fā)明提供的一些實(shí)施例中,選擇所述相似語音排序列表中排名前20個(gè)相似語音進(jìn)行自動(dòng)聲紋鑒定。
在本發(fā)明提供的一些實(shí)施例中,所述自動(dòng)聲紋鑒定為在自動(dòng)聲紋識別給出推薦范圍的基礎(chǔ)上,利用鑒定技術(shù)上的經(jīng)驗(yàn)和規(guī)則進(jìn)行自動(dòng)比對分析,查找關(guān)鍵證據(jù)的方法,所述自動(dòng)聲紋鑒定的方法為:
對獲取的待識別語音進(jìn)行預(yù)處理;
對預(yù)處理的待識別語音進(jìn)行特征提取;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廈門快商通科技股份有限公司,未經(jīng)廈門快商通科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111488987.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





