[發(fā)明專利]聲紋驗(yàn)證方法、裝置、設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202010591954.X | 申請日: | 2020-06-24 |
| 公開(公告)號: | CN111613230A | 公開(公告)日: | 2020-09-01 |
| 發(fā)明(設(shè)計)人: | 李紅巖;劉巖;黨瑩;黃洪運(yùn);李玉瑩 | 申請(專利權(quán))人: | 泰康保險集團(tuán)股份有限公司 |
| 主分類號: | G10L17/00 | 分類號: | G10L17/00;G10L17/02;G10L15/04 |
| 代理公司: | 隆天知識產(chǎn)權(quán)代理有限公司 72003 | 代理人: | 章侃銥;鄭特強(qiáng) |
| 地址: | 100031 北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 聲紋 驗(yàn)證 方法 裝置 設(shè)備 存儲 介質(zhì) | ||
本公開提供一種聲紋驗(yàn)證方法、裝置、設(shè)備及存儲介質(zhì),涉及人工智能技術(shù)領(lǐng)域。該方法包括:獲取密碼字符;獲取輸入語音;對所述輸入語音進(jìn)行語音識別獲得所述輸入語音的語音識別結(jié)果;根據(jù)所述輸入語音的語音識別結(jié)果對所述輸入語音按照字符進(jìn)行切分,獲得多個語音片段;從所述多個語音片段中選取語音識別結(jié)果與所述密碼字符中對應(yīng)位置的密碼字符相一致的語音片段作為待驗(yàn)證語音片段;對所述待驗(yàn)證語音片段進(jìn)行聲紋識別以實(shí)現(xiàn)用戶驗(yàn)證。該方法一定程度上提高了聲紋識別的準(zhǔn)確性。
技術(shù)領(lǐng)域
本公開涉及人工智能技術(shù)領(lǐng)域,具體而言,涉及一種聲紋驗(yàn)證方法、裝置、設(shè)備及可讀存儲介質(zhì)。
背景技術(shù)
聲紋識別,也稱為說話人識別,為一種生物識別技術(shù)。聲紋識別的原理是每一個聲音都具有獨(dú)特的特征,通過該特征能將不同人的聲音進(jìn)行有效的區(qū)分。聲紋識別通常包括以下過程:1)對待識別語音進(jìn)行預(yù)處理;2)提取預(yù)處理后的語音的特征;3)將提取的特征與語音模型庫進(jìn)行模型匹配。在文本相關(guān)的聲紋識別技術(shù)中,模型匹配的精度較差,聲紋識別的準(zhǔn)確率較低。
如上所述,如何提高聲紋識別的準(zhǔn)確率成為亟待解決的問題。
在所述背景技術(shù)部分公開的上述信息僅用于加強(qiáng)對本公開的背景的理解,因此它可以包括不構(gòu)成對本領(lǐng)域普通技術(shù)人員已知的現(xiàn)有技術(shù)的信息。
發(fā)明內(nèi)容
本公開的目的在于提供一種聲紋驗(yàn)證方法、裝置、設(shè)備及可讀存儲介質(zhì),至少在一定程度上克服聲紋識別準(zhǔn)確率較低的問題。
本公開的其他特性和優(yōu)點(diǎn)將通過下面的詳細(xì)描述變得顯然,或部分地通過本公開的實(shí)踐而習(xí)得。
根據(jù)本公開的一方面,提供一種聲紋驗(yàn)證方法,包括:獲取密碼字符;獲取輸入語音;對所述輸入語音進(jìn)行語音識別獲得所述輸入語音的語音識別結(jié)果;根據(jù)所述輸入語音的語音識別結(jié)果對所述輸入語音按照字符進(jìn)行切分,獲得多個語音片段;從所述多個語音片段中選取語音識別結(jié)果與所述密碼字符中對應(yīng)位置的密碼字符相一致的語音片段作為待驗(yàn)證語音片段;對所述待驗(yàn)證語音片段進(jìn)行聲紋識別以實(shí)現(xiàn)用戶驗(yàn)證。
根據(jù)本公開的一實(shí)施例,所述對所述待驗(yàn)證語音片段進(jìn)行聲紋識別以實(shí)現(xiàn)用戶驗(yàn)證包括:獲取所述待驗(yàn)證語音片段的身份向量,所述身份向量表征語音的說話人特征和信道特征;獲取所述待驗(yàn)證語音片段對應(yīng)的密碼字符的預(yù)定用戶的身份向量;基于信道補(bǔ)償算法計算所述待驗(yàn)證語音片段的身份向量與所述預(yù)定用戶的身份向量的相似度。
根據(jù)本公開的一實(shí)施例,所述待驗(yàn)證語音片段包括多個識別結(jié)果一致字符的語音片段;所述獲取所述待驗(yàn)證語音片段的身份向量包括:獲取所述多個識別結(jié)果一致字符的語音片段的多個身份子向量;將所述多個身份子向量進(jìn)行拼接,獲得所述待驗(yàn)證語音片段的身份向量;所述獲取所述待驗(yàn)證語音片段對應(yīng)的密碼字符的預(yù)定用戶的身份向量包括:獲取所述多個識別結(jié)果一致字符的語音片段對應(yīng)的多個密碼字符的所述預(yù)定用戶的多個身份子向量;將所述預(yù)定用戶的多個身份子向量進(jìn)行拼接,獲得所述預(yù)定用戶的身份向量。
根據(jù)本公開的一實(shí)施例,在所述對所述待驗(yàn)證語音片段進(jìn)行聲紋識別以實(shí)現(xiàn)用戶驗(yàn)證之前,所述方法還包括:獲取所述預(yù)定用戶的注冊語音,所述注冊語音包括多個注冊語音片段,所述多個注冊語音片段中的各個注冊語音片段對應(yīng)單個字符;計算所述各個注冊語音片段的身份子向量,獲得所述多個注冊語音片段的多個身份子向量;所述獲取所述多個識別結(jié)果一致字符的語音片段對應(yīng)的密碼字符的所述預(yù)定用戶的多個身份子向量包括:從所述多個注冊語音片段的多個身份子向量中獲取所述預(yù)定用戶的多個身份子向量。
根據(jù)本公開的一實(shí)施例,所述計算所述各個注冊語音片段的身份子向量包括:分別提取所述各個注冊語音片段的特征向量;基于訓(xùn)練獲得的通用背景模型和所述特征向量分別獲得所述各個注冊語音片段的高斯均值超矢量;基于所述各個注冊語音片段的高斯均值超矢量和訓(xùn)練獲得的全局差異空間矩陣獲得所述各個注冊語音片段的身份子向量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于泰康保險集團(tuán)股份有限公司,未經(jīng)泰康保險集團(tuán)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010591954.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:換熱系統(tǒng)
- 下一篇:一種高可靠性長壽命燈具
- 驗(yàn)證系統(tǒng)、驗(yàn)證服務(wù)器、驗(yàn)證方法、驗(yàn)證程序、終端、驗(yàn)證請求方法、驗(yàn)證請求程序和存儲媒體
- 驗(yàn)證目標(biāo)系統(tǒng)的驗(yàn)證系統(tǒng)及其驗(yàn)證方法
- 驗(yàn)證設(shè)備、驗(yàn)證方法和驗(yàn)證程序
- 驗(yàn)證裝置、驗(yàn)證系統(tǒng)以及驗(yàn)證方法
- 驗(yàn)證方法、驗(yàn)證系統(tǒng)、驗(yàn)證設(shè)備及其程序
- 驗(yàn)證方法、用于驗(yàn)證的系統(tǒng)、驗(yàn)證碼系統(tǒng)以及驗(yàn)證裝置
- 圖片驗(yàn)證碼驗(yàn)證方法和圖片驗(yàn)證碼驗(yàn)證裝置
- 驗(yàn)證裝置、驗(yàn)證程序和驗(yàn)證方法
- 驗(yàn)證裝置、驗(yàn)證方法及驗(yàn)證程序
- 跨多個驗(yàn)證域的驗(yàn)證系統(tǒng)、驗(yàn)證方法、驗(yàn)證設(shè)備





