[發(fā)明專利]移動設(shè)備聲紋注冊、認證的方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201210342473.0 | 申請日: | 2012-09-14 |
| 公開(公告)號: | CN103685185B | 公開(公告)日: | 2018-04-27 |
| 發(fā)明(設(shè)計)人: | 劉青松;許星東;許敏強 | 申請(專利權(quán))人: | 上海果殼電子有限公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;G10L17/02;G10L21/0232 |
| 代理公司: | 上海百一領(lǐng)御專利代理事務(wù)所(普通合伙)31243 | 代理人: | 馬育麟 |
| 地址: | 201204 上海市浦東新區(qū)*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 移動 設(shè)備 聲紋 注冊 認證 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及移動設(shè)備加密領(lǐng)域,尤其是涉及移動設(shè)備聲紋注冊、認證的方法及系統(tǒng)。
背景技術(shù)
對于各種移動設(shè)備,如手機、平板電腦、電子書等,需要加密時一般是通過密碼的方式進行加密,例如密碼鎖屏、收件箱加密、文件夾加密、通訊錄加密等等。倘若密碼泄漏或者被盜取時,手機很容易被解鎖,達不到原有的保護用戶隱私的目標。另外,用戶在使用密碼進行解鎖時,通常需要記住之前設(shè)定的密碼,也為用戶的使用帶來不便。
聲紋識別屬于生物識別技術(shù)的一種,是一項根據(jù)語音波形中反映說話人生理和行為特征的語音參數(shù),自動識別說話人身份的技術(shù)。與語音識別不同的是,聲紋識別利用的是語音信號中說話人的語音特點,而不考慮語音中的字詞意思,即它強調(diào)說話人的個性信息;而語音識別的目的是識別出語音信號中的言語(文本)內(nèi)容,并不考慮說話人是誰,它強調(diào)不同說話人之間文本內(nèi)容共性信息。目前,基于聲紋的特征識別技術(shù)已經(jīng)有所發(fā)展?;诼暭y特征識別技術(shù)的認證相對普通的密碼認證解鎖有很大的優(yōu)勢,它不需要記憶密碼,直接利用用戶的語音特征作為身份認證的方式,而且也不會發(fā)生密碼泄漏或者被盜取的問題。
一般的聲紋處理系統(tǒng),如基于聲紋的身份認證系統(tǒng),通常采用聯(lián)網(wǎng)的方式進行聲紋驗證,即,將采集的聲紋發(fā)送給服務(wù)器,然后由服務(wù)器返回認證結(jié)果。發(fā)明人在實現(xiàn)本發(fā)明的過程中發(fā)現(xiàn):這種方式的缺點是每次都需要連接網(wǎng)絡(luò),不適用于沒有網(wǎng)絡(luò)連接或用戶不想聯(lián)網(wǎng)的場景,而且也無法保護用戶的隱私,但是,如果在手機、電子書、平板電腦等移動設(shè)備實現(xiàn)離線聲紋認證,則會因為算法復雜度高、計算量較大、計算時間較長而帶來實時性難以保證的問題,導致用戶體驗度的降低,實用性較差。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實施例的目的是提供移動設(shè)備聲紋注冊、認證的方法及系統(tǒng),以使移動設(shè)備可以離線進行聲紋注冊、認證。
一方面,本發(fā)明實施例公開了一種移動設(shè)備聲紋注冊方法,所述方法包括:
將語音依次進行分幀處理、頻譜分析、聽覺感知濾波,以獲取聲紋特征數(shù)據(jù);
將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲表上,以獲取壓縮后的聲紋特征數(shù)據(jù);根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對應(yīng)的模型統(tǒng)計量;
根據(jù)所述模型統(tǒng)計量建立聲紋模型并標記和存儲,完成聲紋注冊。
優(yōu)選的,所述將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲表上,以獲取壓縮后的聲紋特征,具體包括:
使用所述聲紋特征數(shù)據(jù)的直方圖分布估計聲紋特征的實際分布;
將所述聲紋特征數(shù)據(jù)在所述直方圖分布中的位置作為與所述數(shù)據(jù)存儲表之間映射的索引,通過所述索引將所述聲紋特征數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)存儲表中的數(shù)據(jù),以實現(xiàn)聲紋特征數(shù)據(jù)的壓縮。
優(yōu)選的,所述根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對應(yīng)的模型統(tǒng)計量,具體包括:
對于所述壓縮后的聲紋特征數(shù)據(jù)中的每一幀聲紋特征,根據(jù)模型成分的貢獻大小選擇指定的部分模型成分;
根據(jù)選擇出來的所述部分模型成分為該幀聲紋特征計算模型統(tǒng)計量。
優(yōu)選的,所述方法的至少一個處理步驟中包含對數(shù)計算,所述對數(shù)計算采用如下方式完成:
將待計算的數(shù)據(jù)拆分成兩部分,所述兩部分包括2的整冪數(shù)部分和余下的部分;將硬件中存儲的位數(shù)作為所述2的整冪數(shù)部分的計算結(jié)果;所述余下的部分通過如下近似計算得到:利用多級分段線性擬合逼近原始的對數(shù)計算,擬合的誤差通過分段的級數(shù)控制。
優(yōu)選的,所述將語音依次進行分幀處理、頻譜分析、聽覺感知濾波之前,還包括:
對所述語音進行降噪處理。
優(yōu)選的,所述對所述語音進行降噪處理,具體包括:
對所述語音進行分幀處理,為每一幀語音計算頻譜分析,根據(jù)聽覺感知機制估計每一幀語音頻譜所受到的噪聲影響大小并構(gòu)建對應(yīng)的濾波器參數(shù),經(jīng)過頻域濾波后,得到降噪后的語音頻譜,再通過頻域逆變換,恢復出降噪后的語音。
另一方面,本發(fā)明實施例公開了一種移動設(shè)備聲紋認證方法,其特征在于,所述方法包括:
將語音依次進行分幀處理、頻譜分析、聽覺感知濾波,以獲取聲紋特征數(shù)據(jù);
將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲表上,以獲取壓縮后的聲紋特征數(shù)據(jù);
根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對應(yīng)的模型統(tǒng)計量;
將所述模型統(tǒng)計量與存儲的聲紋模型對比,然后根據(jù)所得匹配度進行認證。
優(yōu)選的,所述將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲表上,以獲取壓縮后的聲紋特征,具體包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海果殼電子有限公司,未經(jīng)上海果殼電子有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210342473.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 傳感設(shè)備、檢索設(shè)備和中繼設(shè)備
- 簽名設(shè)備、檢驗設(shè)備、驗證設(shè)備、加密設(shè)備及解密設(shè)備
- 色彩調(diào)整設(shè)備、顯示設(shè)備、打印設(shè)備、圖像處理設(shè)備
- 驅(qū)動設(shè)備、定影設(shè)備和成像設(shè)備
- 發(fā)送設(shè)備、中繼設(shè)備和接收設(shè)備
- 定點設(shè)備、接口設(shè)備和顯示設(shè)備
- 傳輸設(shè)備、DP源設(shè)備、接收設(shè)備以及DP接受設(shè)備
- 設(shè)備綁定方法、設(shè)備、終端設(shè)備以及網(wǎng)絡(luò)側(cè)設(shè)備
- 設(shè)備、主設(shè)備及從設(shè)備
- 設(shè)備向設(shè)備轉(zhuǎn)發(fā)





