[發(fā)明專利]聲紋注冊方法、系統(tǒng)及計(jì)算機(jī)可讀存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201911098900.3 | 申請日: | 2019-11-11 |
| 公開(公告)號: | CN110827834B | 公開(公告)日: | 2022-07-12 |
| 發(fā)明(設(shè)計(jì))人: | 陳昊亮;許敏強(qiáng);楊世清 | 申請(專利權(quán))人: | 廣州國音智能科技有限公司 |
| 主分類號: | G10L17/22 | 分類號: | G10L17/22;G10L17/02;G10L17/04;G10L17/06;G10L25/24 |
| 代理公司: | 深圳市世紀(jì)恒程知識產(chǎn)權(quán)代理事務(wù)所 44287 | 代理人: | 晏波 |
| 地址: | 510000 廣東省廣州市黃埔*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 聲紋 注冊 方法 系統(tǒng) 計(jì)算機(jī) 可讀 存儲 介質(zhì) | ||
本發(fā)明公開了一種聲紋注冊方法,該方法包括:接收客戶端發(fā)送的注冊語音數(shù)據(jù);將所述注冊語音數(shù)據(jù)平均分割成整數(shù)份語音;分別計(jì)算所述整數(shù)份語音中每一份語音的特征語音向量;將每一份所述語音的特征語音向量進(jìn)行兩兩對比打分,篩選出兩兩打分后比較的差值大于預(yù)設(shè)向量閾值的特征語音向量生成篩選特征語音向量;在注冊語音數(shù)據(jù)中刪除所述篩選特征語音向量對應(yīng)的整數(shù)份語音,生成注冊語音,并對注冊語音進(jìn)行語音注冊。本發(fā)明還公開了一種系統(tǒng)和一種計(jì)算機(jī)可讀存儲介質(zhì)。本發(fā)明能夠降低聲紋注冊環(huán)境對聲紋注冊的影響,提高聲紋識別的準(zhǔn)確率。
技術(shù)領(lǐng)域
本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及聲紋注冊方法、系統(tǒng)及計(jì)算機(jī)可讀存儲介質(zhì)。
背景技術(shù)
目前,通過聲紋作為密碼以進(jìn)行登錄驗(yàn)證網(wǎng)站登錄系統(tǒng)越來越多,具體地,聲紋注冊時系統(tǒng)會提示一定長度的字符串,用戶需要朗誦字符串若干遍才能完成聲紋的注冊;登陸的時候,系統(tǒng)會提示系統(tǒng)的字符串,用戶朗誦一遍,如果聲紋驗(yàn)證一致,則認(rèn)為是用戶本人,予以通過,否則不通過。但是,在聲紋注冊中,如果存在大量的環(huán)境噪音或者存在多人進(jìn)行語音錄入時,必定會影響注冊語音的質(zhì)量,而低質(zhì)量語音影響后續(xù)驗(yàn)證,進(jìn)而影響聲紋識別的可用性。
發(fā)明內(nèi)容
本發(fā)明的主要目的在于提出一種聲紋注冊方法、系統(tǒng)及計(jì)算機(jī)可讀存儲介質(zhì),旨在解決聲紋注冊環(huán)境影響聲紋注冊的技術(shù)問題,提高聲紋識別的準(zhǔn)確率。
為實(shí)現(xiàn)上述目的,本發(fā)明提供一種聲紋注冊方法,所述方法包括如下步驟:
接收客戶端發(fā)送的注冊語音數(shù)據(jù);
將所述注冊語音數(shù)據(jù)平均分割成整數(shù)份語音;
分別計(jì)算所述整數(shù)份語音中每一份語音的特征語音向量;
將每一份所述語音的特征語音向量進(jìn)行兩兩對比打分,篩選出兩兩打分后比較的差值大于預(yù)設(shè)向量閾值的特征語音向量生成篩選特征語音向量;
在注冊語音數(shù)據(jù)中刪除所述篩選特征語音向量對應(yīng)的整數(shù)份語音,生成注冊語音,并對注冊語音進(jìn)行語音注冊。
可選地,所述接收客戶端發(fā)送的注冊語音數(shù)據(jù)的步驟之前,包括:
接收客戶端發(fā)送的語音注冊請求,所述語音注冊請求攜帶有注冊標(biāo)識;
基于所述注冊標(biāo)識進(jìn)入語音注冊流程,依據(jù)與所述語音注冊流程相對應(yīng)的錄音播放順序給所述客戶端發(fā)送至少兩個引導(dǎo)錄音,以使所述客戶端依序播放所述引導(dǎo)錄音;
接收所述客戶端發(fā)送的基于每一所述引導(dǎo)錄音采集到的注冊語音數(shù)據(jù)。
可選地,所述分別計(jì)算所述整數(shù)份語音中每一份語音的特征語音向量的步驟,包括:
分別提取所述整數(shù)份語音中每一份語音的語音特征;
采用簡化模型算法簡化處理所述語音特征,獲取簡化語音特征;
采用最大期望算法迭代所述語音特征,獲取總體變化空間;
將所述簡化語音特征投影到所述總體變化空間,以獲取每一份語音對應(yīng)的特征語音向量。
可選地,所述分別提取所述整數(shù)份語音中每一份語音的語音特征的步驟,包括:
對所述整數(shù)份語音中每一份語音特征進(jìn)行預(yù)處理,獲取預(yù)處理語音數(shù)據(jù);
對所述預(yù)處理語音數(shù)據(jù)作快速傅里葉變換,獲取每一份所述語音的頻譜,并根據(jù)所述頻譜獲取每一份所述語音的功率譜;
采用梅爾刻度濾波器組處理每一份所述語音的功率譜,獲取每一份所述語音的梅爾功率譜;
在所述梅爾功率譜上對每一份所述語音進(jìn)行倒譜分析,得到語音特征。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州國音智能科技有限公司,未經(jīng)廣州國音智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911098900.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





