[發(fā)明專利]移動設(shè)備聲紋注冊、認證的方法及系統(tǒng)有效

申請?zhí)枺?/td>	201210342473.0	申請日：	2012-09-14
公開（公告）號：	CN103685185B	公開（公告）日：	2018-04-27
發(fā)明（設(shè)計）人：	劉青松;許星東;許敏強	申請（專利權(quán)）人：	上海果殼電子有限公司
主分類號：	H04L29/06	分類號：	H04L29/06;G10L17/02;G10L21/0232
代理公司：	上海百一領(lǐng)御專利代理事務(wù)所(普通合伙)31243	代理人：	馬育麟
地址：	201204 上海市浦東新區(qū)***	國省代碼：	上海;31
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	移動設(shè)備聲紋注冊認證方法系統(tǒng)
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

技術(shù)領(lǐng)域

本發(fā)明涉及移動設(shè)備加密領(lǐng)域，尤其是涉及移動設(shè)備聲紋注冊、認證的方法及系統(tǒng)。

背景技術(shù)

對于各種移動設(shè)備，如手機、平板電腦、電子書等，需要加密時一般是通過密碼的方式進行加密，例如密碼鎖屏、收件箱加密、文件夾加密、通訊錄加密等等。倘若密碼泄漏或者被盜取時，手機很容易被解鎖，達不到原有的保護用戶隱私的目標。另外，用戶在使用密碼進行解鎖時，通常需要記住之前設(shè)定的密碼，也為用戶的使用帶來不便。

聲紋識別屬于生物識別技術(shù)的一種，是一項根據(jù)語音波形中反映說話人生理和行為特征的語音參數(shù)，自動識別說話人身份的技術(shù)。與語音識別不同的是，聲紋識別利用的是語音信號中說話人的語音特點，而不考慮語音中的字詞意思，即它強調(diào)說話人的個性信息；而語音識別的目的是識別出語音信號中的言語（文本）內(nèi)容，并不考慮說話人是誰，它強調(diào)不同說話人之間文本內(nèi)容共性信息。目前，基于聲紋的特征識別技術(shù)已經(jīng)有所發(fā)展?；诼暭y特征識別技術(shù)的認證相對普通的密碼認證解鎖有很大的優(yōu)勢，它不需要記憶密碼，直接利用用戶的語音特征作為身份認證的方式，而且也不會發(fā)生密碼泄漏或者被盜取的問題。

一般的聲紋處理系統(tǒng)，如基于聲紋的身份認證系統(tǒng)，通常采用聯(lián)網(wǎng)的方式進行聲紋驗證，即，將采集的聲紋發(fā)送給服務(wù)器，然后由服務(wù)器返回認證結(jié)果。發(fā)明人在實現(xiàn)本發(fā)明的過程中發(fā)現(xiàn)：這種方式的缺點是每次都需要連接網(wǎng)絡(luò)，不適用于沒有網(wǎng)絡(luò)連接或用戶不想聯(lián)網(wǎng)的場景，而且也無法保護用戶的隱私，但是，如果在手機、電子書、平板電腦等移動設(shè)備實現(xiàn)離線聲紋認證，則會因為算法復雜度高、計算量較大、計算時間較長而帶來實時性難以保證的問題，導致用戶體驗度的降低，實用性較差。

發(fā)明內(nèi)容

有鑒于此，本發(fā)明實施例的目的是提供移動設(shè)備聲紋注冊、認證的方法及系統(tǒng)，以使移動設(shè)備可以離線進行聲紋注冊、認證。

一方面，本發(fā)明實施例公開了一種移動設(shè)備聲紋注冊方法，所述方法包括：

將語音依次進行分幀處理、頻譜分析、聽覺感知濾波，以獲取聲紋特征數(shù)據(jù)；

將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲表上，以獲取壓縮后的聲紋特征數(shù)據(jù)；根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對應(yīng)的模型統(tǒng)計量；

根據(jù)所述模型統(tǒng)計量建立聲紋模型并標記和存儲，完成聲紋注冊。

優(yōu)選的，所述將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲表上，以獲取壓縮后的聲紋特征，具體包括：

使用所述聲紋特征數(shù)據(jù)的直方圖分布估計聲紋特征的實際分布；

將所述聲紋特征數(shù)據(jù)在所述直方圖分布中的位置作為與所述數(shù)據(jù)存儲表之間映射的索引，通過所述索引將所述聲紋特征數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)存儲表中的數(shù)據(jù)，以實現(xiàn)聲紋特征數(shù)據(jù)的壓縮。

優(yōu)選的，所述根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對應(yīng)的模型統(tǒng)計量，具體包括：

對于所述壓縮后的聲紋特征數(shù)據(jù)中的每一幀聲紋特征，根據(jù)模型成分的貢獻大小選擇指定的部分模型成分；

根據(jù)選擇出來的所述部分模型成分為該幀聲紋特征計算模型統(tǒng)計量。

優(yōu)選的，所述方法的至少一個處理步驟中包含對數(shù)計算，所述對數(shù)計算采用如下方式完成：

將待計算的數(shù)據(jù)拆分成兩部分，所述兩部分包括2的整冪數(shù)部分和余下的部分；將硬件中存儲的位數(shù)作為所述2的整冪數(shù)部分的計算結(jié)果；所述余下的部分通過如下近似計算得到：利用多級分段線性擬合逼近原始的對數(shù)計算，擬合的誤差通過分段的級數(shù)控制。

優(yōu)選的，所述將語音依次進行分幀處理、頻譜分析、聽覺感知濾波之前，還包括：

對所述語音進行降噪處理。

優(yōu)選的，所述對所述語音進行降噪處理，具體包括：

對所述語音進行分幀處理，為每一幀語音計算頻譜分析，根據(jù)聽覺感知機制估計每一幀語音頻譜所受到的噪聲影響大小并構(gòu)建對應(yīng)的濾波器參數(shù)，經(jīng)過頻域濾波后，得到降噪后的語音頻譜，再通過頻域逆變換，恢復出降噪后的語音。

另一方面，本發(fā)明實施例公開了一種移動設(shè)備聲紋認證方法，其特征在于，所述方法包括：

將語音依次進行分幀處理、頻譜分析、聽覺感知濾波，以獲取聲紋特征數(shù)據(jù)；

將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲表上，以獲取壓縮后的聲紋特征數(shù)據(jù)；

根據(jù)所述壓縮后的聲紋特征數(shù)據(jù)獲取對應(yīng)的模型統(tǒng)計量；

將所述模型統(tǒng)計量與存儲的聲紋模型對比，然后根據(jù)所得匹配度進行認證。

優(yōu)選的，所述將所述聲紋特征數(shù)據(jù)映射到已經(jīng)量化的數(shù)據(jù)存儲表上，以獲取壓縮后的聲紋特征，具體包括：

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海果殼電子有限公司，未經(jīng)上海果殼電子有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201210342473.0/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。