[發(fā)明專利]一種聲紋識別方法、系統(tǒng)、設備及存儲介質在審
| 申請?zhí)枺?/td> | 202210233039.2 | 申請日: | 2022-03-09 |
| 公開(公告)號: | CN114842851A | 公開(公告)日: | 2022-08-02 |
| 發(fā)明(設計)人: | 葉林勇;肖龍源;李稀敏;葉志堅 | 申請(專利權)人: | 廈門快商通科技股份有限公司 |
| 主分類號: | G10L17/00 | 分類號: | G10L17/00;G10L17/02;G10L17/04 |
| 代理公司: | 廈門仕誠聯(lián)合知識產(chǎn)權代理事務所(普通合伙) 35227 | 代理人: | 蔡稷元 |
| 地址: | 361009 福建省廈門市集*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 聲紋 識別 方法 系統(tǒng) 設備 存儲 介質 | ||
1.一種聲紋識別方法,其特征在于,所述方法包括以下步驟:
實時獲取語音數(shù)據(jù);
對獲取的語音數(shù)據(jù)進行預處理;
對預處理后的語音數(shù)據(jù)進行特征提??;
將提取到的特征按照現(xiàn)有的數(shù)據(jù)場景輸入模型A或模型B,得到建模后的聲學特征;
將建模后的聲學特征部署到服務器上。
2.根據(jù)權利要求1所述的聲紋識別方法,其特征在于,所述實時獲取語音數(shù)據(jù),包括:
分別采集電話信道語音場景和視頻語音場景。
3.根據(jù)權利要求2所述的聲紋識別方法,其特征在于,所述對獲取的語音數(shù)據(jù)進行預處理,包括:
采樣量化,將獲取的語音數(shù)據(jù),以8kHz的采樣速率數(shù)字化,輸入到后端服務器;
預加重,將輸入到后端服務器聲音經(jīng)過8kHz的采樣速率的采樣后轉成數(shù)字語音信號,然后通過一階高通濾波器來作預加重處理以突顯高頻部分;
取音框,取256點為一個音框,音框與音框之間重迭128點,即每次位移128點后再取256點作為下一個音框;
加窗,針對每一個音框乘上漢明窗以消除音框兩端的不連續(xù)性,將音框通過低通濾波器。
4.根據(jù)權利要求3所述的聲紋識別方法,其特征在于,所述將輸入到后端服務器聲音經(jīng)過8kHz的采樣速率的采樣后轉成數(shù)字語音信號,其傳遞函數(shù)為:H(z)=1-az-1,H(z)為輸出信號,z為輸入信號,a為濾波系數(shù)。
5.根據(jù)權利要求4所述的聲紋識別方法,其特征在于,所述a的取值為0.95。
6.根據(jù)權利要求5所述的聲紋識別方法,其特征在于,所述對預處理后的語音數(shù)據(jù)進行特征提取,包括:
使用改進型Mel頻率倒譜系數(shù)方法提取特征,其中,計算方式如下:f為輸入頻率,將音頻文件通過短時傅里葉變換得到,γ為頻率調節(jié)系數(shù)。
7.一種聲紋識別系統(tǒng),其特征在于,包括:
獲取模塊,用于實時獲取語音數(shù)據(jù);
處理模塊,用于對獲取的語音數(shù)據(jù)進行預處理;
提取模塊,用于對預處理后的語音數(shù)據(jù)進行特征提取;
建模模塊,用于將提取到的特征按照現(xiàn)有的數(shù)據(jù)場景輸入模型A或模型B,得到建模后的聲學特征;
部署模塊,用于將建模后的聲學特征部署到服務器上。
8.一種聲紋識別設備,其特征在于,包括:
存儲器,用于存儲計算機程序;
處理器,用于執(zhí)行所述計算機程序時實現(xiàn)如權利要求1至6中任一項所述的聲紋識別方法的步驟。
9.一種存儲介質,其特征在于,其上存儲有計算機程序,其特征在于,所述程序被處理器執(zhí)行時實現(xiàn)如權利要求1至6中任一項所述的聲紋識別方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門快商通科技股份有限公司,未經(jīng)廈門快商通科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210233039.2/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





