[發(fā)明專利]一種語音處理方法、裝置和智能終端在審
| 申請?zhí)枺?/td> | 201610082180.1 | 申請日: | 2016-02-05 |
| 公開(公告)號: | CN107046517A | 公開(公告)日: | 2017-08-15 |
| 發(fā)明(設計)人: | 萬玉龍;劉敏;張軼樂 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;G10L17/04;G10L17/02;G10L15/22 |
| 代理公司: | 北京潤澤恒知識產(chǎn)權代理有限公司11319 | 代理人: | 蘇培華 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 處理 方法 裝置 智能 終端 | ||
技術領域
本申請涉及語音處理技術領域,特別是涉及一種語音處理方法、一種語音處理裝置和一種智能終端。
背景技術
語音識別可以讓機器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳奈谋净蛎睢kS著終端技術的發(fā)展,越來越多的智能終端中已經(jīng)加入的語音識別技術,即可以通過語音識別喚醒智能終端的相應功能,如解鎖、啟動應用等。
以通過語音識別進行解鎖為例,通常是接收用戶讀出包含固定內(nèi)容的語音信號,從而識別該語音信號進行解鎖。這種解鎖僅識別語音信號對應文本內(nèi)容,若識別的文本符合解鎖條件就能夠解鎖。但是,在公眾場合讀入語音時很容易被他人獲知,非用戶本人通過錄音片段也可順利解鎖,安全系數(shù)較低。
因此,目前需要本領域技術人員迫切解決的一個技術問題就是:提出一種語音處理方法、裝置和智能終端,以解決現(xiàn)有語音喚醒安全性較低的問題。
發(fā)明內(nèi)容
本申請實施例所要解決的技術問題是提供一種語音處理方法,以解決現(xiàn)有語音喚醒安全性較低的問題。
相應的,本申請實施例還提供了一種語音處理裝置和一種智能終端,用以保證上述方法的實現(xiàn)及應用。
為了解決上述問題,本申請公開了一種語音處理方法,包括:接收用戶輸入的語音信號;檢測所述語音信號與解密密令是否匹配,其中,所述解密密令包括生成的動態(tài)密令;當所述語音信號與解密密令匹配時,對所述語音信號進行響應。
可選的,還包括:采用所述用戶的聲紋模型對所述語音信號進行用戶驗 證。
可選的,還包括預先執(zhí)行以下聲紋注冊步驟:依據(jù)訓練語音信號生成所述用戶的聲紋模型。
可選的,所述依據(jù)訓練語音信號生成所述用戶的聲紋模型,包括:對海量用戶的訓練語音信號進行預處理,將預處理得到的第一語音特征進行訓練生成通用背景模型;對所述用戶的訓練語音信號進行預處理,確定所述用戶的第二語音特征;利用第二語音特征對通用背景模型進行迭代更新,生成所述用戶的聲紋模型。
可選的,利用第二語音特征對通用背景模型進行迭代更新,生成所述用戶的聲紋模型,包括:采用所述第二語音特征對通用背景模型進行最大后驗估計,生成所述用戶的聲紋模型。
可選的,還包括:依次接收用戶各次輸入的注冊語音信號,依據(jù)所述注冊語音生成所述用戶的訓練語音信號。
可選的,還包括:設定所述用戶的密令變換規(guī)則
可選的,所述設定所述用戶的密令變換規(guī)則,包括:獲取用戶輸入的密令參數(shù)和密令變量,將所述密令參數(shù)和密令變量構成密令變換規(guī)則。
可選的,采用所述用戶的聲紋模型對所述語音信號進行用戶驗證,包括:對所述語音信號進行預處理,確定第三語音特征;采用所述第三語音特征和所述用戶的聲紋模型進行匹配,依據(jù)匹配結果進行用戶驗證。
可選的,采用所述第三語音特征和所述用戶的聲紋模型進行匹配,依據(jù)匹配結果進行用戶驗證,包括:采用所述用戶的聲紋模型對所述第三語音特征進行匹配,確定第一分值;依據(jù)所述第一分值確定匹配結果的第二分值,將所述第二分值和驗證閾值進行比較;當所述第二分值超過驗證閾值時,確認用戶驗證通過;當所述第二分值未超過驗證閾值時,確認用戶驗證未通過。
可選的,確定第三語音特征之后,還包括:采用所述通用背景模型對所述第三語音特征進行匹配,確定第三分值;所述依據(jù)所述第一分值確定匹配結果的第二分值,包括:計算所述第一分值和第三分值的差值,將所述差值作為第二分值。
可選的,對語音信號進行預處理確定語音特征的步驟包括:對語音信號進行分幀,獲取各幀的語音數(shù)據(jù);對各幀語音數(shù)據(jù)進行特征提取,確定語音特征。
可選的,檢測所述語音信號是否與解密密令匹配,包括:對所述語音信號進行語音識別,轉(zhuǎn)換得到文本數(shù)據(jù);檢測所述文本數(shù)據(jù)和解密密令是否匹配。
可選的,檢測所述語音信號是否與解密密令匹配之前,還包括:依據(jù)所述密令變換規(guī)則生成動態(tài)密令,將所述動態(tài)密令作為解密密令。
可選的,依據(jù)所述密令變換規(guī)則生成解密密令,包括:依據(jù)所述密令變量對密令參數(shù)進行組合,生成解密密令。
可選的,所述密令參數(shù)包括小于10的非負整數(shù);所述密令變量包括:時間變量。
可選的,所述解密密令包括:年份、月份、日期、紀念日、節(jié)日中一種或兩種以上的組合。
可選的,所述對所述語音信號進行響應,包括:執(zhí)行喚醒操作,其中,所述喚醒操作包括智能終端的解鎖操作。
可選的,還包括:當用戶驗證未通過,或語音信號與解密密令不匹配時,提示語音喚醒失敗。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經(jīng)阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610082180.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





