[發(fā)明專(zhuān)利]一種語(yǔ)音和唇語(yǔ)相融合的身份認(rèn)證方法在審
| 申請(qǐng)?zhí)枺?/td> | 201910603999.1 | 申請(qǐng)日: | 2019-07-05 |
| 公開(kāi)(公告)號(hào): | CN110364163A | 公開(kāi)(公告)日: | 2019-10-22 |
| 發(fā)明(設(shè)計(jì))人: | 張新曼;申沅均;陳奕宇;公維勇;王寅;尚東鵬;許學(xué)斌 | 申請(qǐng)(專(zhuān)利權(quán))人: | 西安交通大學(xué);廣東順德西安交通大學(xué)研究院 |
| 主分類(lèi)號(hào): | G10L15/25 | 分類(lèi)號(hào): | G10L15/25;G10L25/24;G10L15/06;G10L25/45;G10L25/51;G10L17/00 |
| 代理公司: | 西安通大專(zhuān)利代理有限責(zé)任公司 61200 | 代理人: | 安彥彥 |
| 地址: | 710049 *** | 國(guó)省代碼: | 陜西;61 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 身份認(rèn)證 語(yǔ)音 融合 認(rèn)證成功 向量特征 倒頻譜 身份認(rèn)證系統(tǒng) 極限學(xué)習(xí)機(jī) 并行策略 認(rèn)證領(lǐng)域 認(rèn)證失敗 生物特征 輸出結(jié)果 信息安全 訓(xùn)練樣本 多輸出 強(qiáng)健性 提示符 多模 復(fù)數(shù) 向量 輸出 認(rèn)證 | ||
本發(fā)明公開(kāi)了一種語(yǔ)音和唇語(yǔ)相融合的身份認(rèn)證方法,涉及信息安全及模式認(rèn)證領(lǐng)域。該語(yǔ)音和唇語(yǔ)相融合的身份認(rèn)證方法包括以下步驟:1)提取待認(rèn)證的語(yǔ)音倒頻譜特征和唇語(yǔ)特征;2)采用并行策略融合所述語(yǔ)音倒頻譜特征和所述唇語(yǔ)特征,得到復(fù)向量特征;3)利用復(fù)向量特征作為訓(xùn)練樣本訓(xùn)練復(fù)數(shù)極限學(xué)習(xí)機(jī)的多輸入多輸出模型,根據(jù)輸出的分布及其取值判斷是否認(rèn)證成功;若輸出結(jié)果向量中的最大值與提示符一致且該值大于設(shè)定閾值,則認(rèn)證成功;否則,認(rèn)證失敗。該語(yǔ)音和唇語(yǔ)相融合的身份認(rèn)證方法,采用語(yǔ)音和唇語(yǔ)相結(jié)合的多模生物特征進(jìn)行身份認(rèn)證,提高了身份認(rèn)證系統(tǒng)的強(qiáng)健性。
技術(shù)領(lǐng)域
發(fā)明涉及信息安全及模式認(rèn)證領(lǐng)域,具體涉及一種語(yǔ)音和唇語(yǔ)相融合的身份 認(rèn)證方法。
背景技術(shù)
隨著網(wǎng)絡(luò)信息技術(shù)的飛速發(fā)展,世界進(jìn)入了移動(dòng)互聯(lián)網(wǎng)時(shí)代。2017年上半年, 智能手機(jī)幾乎人手一部。移動(dòng)電商和網(wǎng)上銀行等虛擬移動(dòng)支付平臺(tái)也隨之興起, 但是與此同時(shí),網(wǎng)絡(luò)病毒、黑客以及電信詐騙等網(wǎng)絡(luò)犯罪時(shí)刻威脅著手機(jī)用戶(hù)的 信息安全,甚至可能造成重大的經(jīng)濟(jì)損失。因此,亟待一個(gè)高度可靠的身份認(rèn)證 系統(tǒng),將生物特征認(rèn)證和智能手機(jī)平臺(tái)進(jìn)行融合由此應(yīng)運(yùn)而生。
語(yǔ)音認(rèn)證是被認(rèn)為在智能手機(jī)認(rèn)證上具有廣泛應(yīng)用前景的生物特征認(rèn)證技 術(shù)之一。語(yǔ)音認(rèn)證具有非接觸、非侵入性和易于使用的特點(diǎn)。近年來(lái)也在取得了 技術(shù)上的重大的突破,例如在語(yǔ)音識(shí)別的Switchboard任務(wù)方面,最新的IBM已 經(jīng)能將錯(cuò)誤率控制在5.5%之下,有經(jīng)驗(yàn)的轉(zhuǎn)寫(xiě)人員在這個(gè)任務(wù)中可以達(dá)到4%之 下。因此,這類(lèi)安靜環(huán)境下的語(yǔ)音識(shí)別系統(tǒng)已經(jīng)近似于人類(lèi)水平。但單通道的語(yǔ) 音認(rèn)證受環(huán)境影響較大,其認(rèn)證準(zhǔn)確率也有待進(jìn)一步的提高。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服上述現(xiàn)有技術(shù)的缺點(diǎn),提供一種語(yǔ)音和唇語(yǔ)相融合的 身份認(rèn)證方法。
為達(dá)到上述目的,本發(fā)明采用以下技術(shù)方案予以實(shí)現(xiàn):
一種語(yǔ)音和唇語(yǔ)相融合的身份認(rèn)證方法,包括以下步驟:
1)提取待認(rèn)證的語(yǔ)音倒頻譜特征和唇語(yǔ)特征;
2)采用并行策略融合所述語(yǔ)音倒頻譜特征和所述唇語(yǔ)特征,得到復(fù)向量特 征;
3)利用復(fù)向量特征作為訓(xùn)練樣本訓(xùn)練復(fù)數(shù)極限學(xué)習(xí)機(jī)的多輸入多輸出模型, 根據(jù)輸出的分布及其取值判斷是否認(rèn)證成功;
若輸出結(jié)果向量中的最大值與設(shè)定提示符一致且最大值大于設(shè)定閾值,則認(rèn) 證成功;否則,認(rèn)證失敗。
進(jìn)一步的,步驟1)中語(yǔ)音倒頻譜特征的提取方法具體過(guò)程為:
利用雙門(mén)限法對(duì)語(yǔ)音信號(hào)進(jìn)行分段,并采用梅爾濾波器提取語(yǔ)音倒頻譜特征。
進(jìn)一步的,利用雙門(mén)限法對(duì)語(yǔ)音信號(hào)進(jìn)行分段的具體過(guò)程為:
用交疊分段的方法對(duì)語(yǔ)音信號(hào)進(jìn)行分幀,得到短時(shí)序列;
用窗函數(shù)乘以短時(shí)序列,形成短時(shí)加窗語(yǔ)音信號(hào);
利用短時(shí)加窗語(yǔ)音信號(hào)的短時(shí)能量和短時(shí)過(guò)零率截出語(yǔ)音段的起止點(diǎn),起止 點(diǎn)之間的語(yǔ)音即為有效語(yǔ)音段。
進(jìn)一步的,利用短時(shí)加窗語(yǔ)音信號(hào)的短時(shí)能量和短時(shí)過(guò)零率截出有效語(yǔ)音段 的起止點(diǎn)的具體過(guò)程包括以下步驟:
1)計(jì)算每幀音頻的短時(shí)能量和短時(shí)過(guò)零率,計(jì)算公式如下所示,短時(shí)能量 為
短時(shí)過(guò)零率為
其中,xn(m)代表第n幀的第m個(gè)序列值,sgn[]代表符號(hào)函數(shù);
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于西安交通大學(xué);廣東順德西安交通大學(xué)研究院,未經(jīng)西安交通大學(xué);廣東順德西安交通大學(xué)研究院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910603999.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:一種人工智能的重置方法及裝置、存儲(chǔ)介質(zhì)
- 下一篇:對(duì)話(huà)控制裝置、對(duì)話(huà)系統(tǒng)、對(duì)話(huà)控制方法以及存儲(chǔ)介質(zhì)
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L15-00 語(yǔ)音識(shí)別
G10L15-02 .語(yǔ)音識(shí)別的特征提取;識(shí)別單位的選擇
G10L15-04 .分段或字極限檢測(cè)
G10L15-06 .創(chuàng)建基準(zhǔn)模板;訓(xùn)練語(yǔ)音識(shí)別系統(tǒng),例如對(duì)說(shuō)話(huà)者聲音特征的適應(yīng)
G10L15-08 .語(yǔ)音分類(lèi)或檢索
G10L15-20 .專(zhuān)門(mén)適用于不利環(huán)境
- 一種身份認(rèn)證方法及用戶(hù)終端
- 一種雙模式身份認(rèn)證的支付平臺(tái)的使用方法
- 雙模式身份認(rèn)證的支付平臺(tái)
- 一種身份認(rèn)證復(fù)核的方法、裝置及服務(wù)器
- 身份認(rèn)證服務(wù)器、身份認(rèn)證終端、身份認(rèn)證系統(tǒng)及方法
- 身份認(rèn)證方法及裝置
- 一種識(shí)別身份認(rèn)證裝置的方法、設(shè)備以及圖像形成裝置
- 一種身份認(rèn)證方法及裝置
- 身份認(rèn)證器的初始化、身份認(rèn)證方法以及裝置
- 大數(shù)據(jù)系統(tǒng)中對(duì)用戶(hù)身份進(jìn)行認(rèn)證的方法、裝置及相關(guān)產(chǎn)品
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)





