[發(fā)明專利]聲紋判別方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202110536905.0 | 申請(qǐng)日: | 2021-05-17 |
| 公開(kāi)(公告)號(hào): | CN113327618A | 公開(kāi)(公告)日: | 2021-08-31 |
| 發(fā)明(設(shè)計(jì))人: | 梁萌;付中華;王海坤 | 申請(qǐng)(專利權(quán))人: | 西安訊飛超腦信息科技有限公司 |
| 主分類號(hào): | G10L17/02 | 分類號(hào): | G10L17/02;G10L17/04;G10L17/08;G10L21/028;G10L25/54;G10L25/60 |
| 代理公司: | 廣州華進(jìn)聯(lián)合專利商標(biāo)代理有限公司 44224 | 代理人: | 謝曲曲 |
| 地址: | 710000 陜西省西安市高新區(qū)西*** | 國(guó)省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 聲紋 判別 方法 裝置 計(jì)算機(jī) 設(shè)備 存儲(chǔ) 介質(zhì) | ||
本申請(qǐng)涉及一種聲紋判別方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)。方法包括:獲取目標(biāo)相關(guān)系數(shù);基于檢材數(shù)據(jù),對(duì)檢材語(yǔ)音庫(kù)中的語(yǔ)音樣本作預(yù)設(shè)處理,以使得檢材語(yǔ)音庫(kù)中語(yǔ)音樣本的語(yǔ)音質(zhì)量與檢材數(shù)據(jù)的語(yǔ)音質(zhì)量相匹配;將每一對(duì)比對(duì)的相關(guān)系數(shù)輸入至預(yù)設(shè)模型,輸出每一對(duì)比對(duì)的對(duì)數(shù)似然比;根據(jù)每一對(duì)比對(duì)的對(duì)數(shù)似然比,獲取預(yù)設(shè)閾值,并基于預(yù)設(shè)閾值,對(duì)目標(biāo)相關(guān)系數(shù)進(jìn)行判別。由于可以將檢材語(yǔ)音庫(kù)中語(yǔ)音樣本的語(yǔ)音質(zhì)量與檢材數(shù)據(jù)的語(yǔ)音質(zhì)量進(jìn)行拉齊,并由檢材語(yǔ)音庫(kù)與樣本語(yǔ)音庫(kù)擬合出預(yù)設(shè)閾值,從而使得預(yù)設(shè)閾值可隨著檢材數(shù)據(jù)其語(yǔ)音質(zhì)量的變化而相應(yīng)變化,不再是固定值,進(jìn)而可以大大減少聲紋同源判別時(shí)的主觀性,并提高聲紋同源判定時(shí)的準(zhǔn)確度。
技術(shù)領(lǐng)域
本申請(qǐng)涉及聲音識(shí)別技術(shù)領(lǐng)域,特別是涉及一種聲紋判別方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)。
背景技術(shù)
隨著聲紋識(shí)別技術(shù)的迅速發(fā)展,現(xiàn)在聲紋比對(duì)是主要是基于深度學(xué)習(xí)方法。具體地,鑒定人員會(huì)將需要比對(duì)的檢材數(shù)據(jù)輸入深度學(xué)習(xí)系統(tǒng),系統(tǒng)會(huì)將此檢材數(shù)據(jù)和系統(tǒng)中收集的眾多樣本數(shù)據(jù)進(jìn)行逐一比對(duì),系統(tǒng)會(huì)對(duì)每一對(duì)數(shù)據(jù)進(jìn)行相關(guān)分析,并給出相似度指標(biāo)(通常是聲紋特征向量的距離評(píng)價(jià))的分值。該分值越大,表明兩者同源可能性越大;反之,異源可能性越大。在實(shí)際的深度學(xué)習(xí)系統(tǒng)中,一般會(huì)設(shè)定一個(gè)閾值(一般是經(jīng)驗(yàn)值),用于鑒定人員進(jìn)行同源的判別認(rèn)定。
在上述過(guò)程中,閾值的設(shè)定是十分關(guān)鍵的。在相關(guān)技術(shù)中,通常是將固定的經(jīng)驗(yàn)值作為閾值。由于每次在收集作為證據(jù)的檢材數(shù)據(jù)時(shí),外部環(huán)境和信道均可能會(huì)不同,從而一直使用固定閾值與相似度指標(biāo)的分值進(jìn)行比較,會(huì)可能會(huì)因?yàn)殚撝翟O(shè)置過(guò)小而發(fā)生誤判,或者因閾值設(shè)置過(guò)大而發(fā)生誤判的情形,進(jìn)而嚴(yán)重影響鑒定結(jié)果的準(zhǔn)確性。
發(fā)明內(nèi)容
基于此,有必要針對(duì)上述技術(shù)問(wèn)題,提供一種能夠提高檢材數(shù)據(jù)鑒定結(jié)果準(zhǔn)確性的聲紋處理方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)。
一種聲紋處理方法,該方法包括:
獲取目標(biāo)相關(guān)系數(shù),目標(biāo)相關(guān)系數(shù)是由檢材數(shù)據(jù)的聲紋特征與樣本數(shù)據(jù)的聲紋特征所確定的;
基于檢材數(shù)據(jù),對(duì)檢材語(yǔ)音庫(kù)中的語(yǔ)音樣本作預(yù)設(shè)處理,以使得檢材語(yǔ)音庫(kù)中語(yǔ)音樣本的語(yǔ)音質(zhì)量與檢材數(shù)據(jù)的語(yǔ)音質(zhì)量相匹配;
將每一對(duì)比對(duì)的相關(guān)系數(shù)輸入至預(yù)設(shè)模型,輸出每一對(duì)比對(duì)的對(duì)數(shù)似然比,預(yù)設(shè)模型是基于樣本對(duì)比對(duì)及樣本對(duì)比對(duì)的標(biāo)注結(jié)果所訓(xùn)練得到的,所有對(duì)比對(duì)包括同源對(duì)比對(duì)及異源對(duì)比對(duì);
根據(jù)每一對(duì)比對(duì)的對(duì)數(shù)似然比,獲取預(yù)設(shè)閾值,并基于預(yù)設(shè)閾值,對(duì)目標(biāo)相關(guān)系數(shù)進(jìn)行判別;
其中,同源對(duì)比對(duì)是基于相同說(shuō)話人身份分別在樣本特征庫(kù)及檢材特征庫(kù)選取一條聲紋特征所構(gòu)成的,異源特征對(duì)是基于不同說(shuō)話人身份分別在樣本特征庫(kù)及檢材特征庫(kù)選取一條聲紋特征所構(gòu)成的,樣本特征庫(kù)是由樣本語(yǔ)音庫(kù)中語(yǔ)音樣本對(duì)應(yīng)的聲紋特征所構(gòu)成的,檢材特征庫(kù)是由檢材語(yǔ)音庫(kù)中語(yǔ)音樣本對(duì)應(yīng)的聲紋特征所構(gòu)成的。
在其中一個(gè)實(shí)施例中,基于檢材數(shù)據(jù),對(duì)檢材語(yǔ)音庫(kù)中的語(yǔ)音樣本作預(yù)設(shè)處理,以使得檢材語(yǔ)音庫(kù)中語(yǔ)音樣本的語(yǔ)音質(zhì)量與檢材數(shù)據(jù)的語(yǔ)音質(zhì)量相匹配,包括;
獲取檢材數(shù)據(jù)的質(zhì)量參數(shù)組;
根據(jù)質(zhì)量參數(shù)組中每項(xiàng)質(zhì)量參數(shù)的取值及類型,對(duì)檢材語(yǔ)音庫(kù)中的語(yǔ)音樣本進(jìn)行調(diào)整,以使得檢材語(yǔ)音庫(kù)中每一語(yǔ)音樣本的每項(xiàng)質(zhì)量參數(shù)的取值與質(zhì)量參數(shù)組中每項(xiàng)質(zhì)量參數(shù)的取值相匹配。
在其中一個(gè)實(shí)施例中,質(zhì)量參數(shù)組中包括以下四項(xiàng)質(zhì)量參數(shù)中的至少任意一項(xiàng),以下四項(xiàng)質(zhì)量參數(shù)分別為信噪比、語(yǔ)音有效時(shí)長(zhǎng)、噪聲類型及信道頻率響應(yīng)。
在其中一個(gè)實(shí)施例中,將每一對(duì)比對(duì)的相關(guān)系數(shù)輸入至預(yù)設(shè)模型,輸出每一對(duì)比對(duì)的對(duì)數(shù)似然比之前,還包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安訊飛超腦信息科技有限公司,未經(jīng)西安訊飛超腦信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110536905.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種快速識(shí)別聲紋方法和系統(tǒng)
- 聲紋遙控器
- 一種自學(xué)習(xí)聲紋識(shí)別的更新方法和裝置
- 基于聲紋信息的身份認(rèn)證及識(shí)別方法
- 一種聲紋數(shù)據(jù)庫(kù)建立方法、聲紋識(shí)別方法、裝置及系統(tǒng)
- 聲紋信息的比對(duì)方法及裝置、儲(chǔ)存介質(zhì)、電子裝置
- 聲紋認(rèn)證方法、裝置、計(jì)算機(jī)設(shè)備以及存儲(chǔ)介質(zhì)
- 一種處理方法及電子設(shè)備
- 聲紋相似度智能識(shí)別系統(tǒng)、方法及存儲(chǔ)介質(zhì)
- 碰撞檢測(cè)方法、機(jī)器人、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 判別設(shè)備、判別方法和計(jì)算機(jī)程序
- 物體檢測(cè)裝置以及物體檢測(cè)方法
- 圖像處理裝置以及圖像處理方法
- 模擬傳感器的種類判別裝置
- 一種水電站砂層土質(zhì)液化評(píng)判方法
- 基于CNN神經(jīng)網(wǎng)絡(luò)的急性心肌梗死定性自動(dòng)判別系統(tǒng)
- 一種基于CNN神經(jīng)網(wǎng)絡(luò)的急性心肌梗死定位自動(dòng)判別系統(tǒng)
- 一種活體人臉的判別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 糖網(wǎng)病眼底圖像的樣本數(shù)據(jù)標(biāo)注系統(tǒng)
- 一種循環(huán)漸進(jìn)式局部放電判別方法
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





