[發(fā)明專利]語音喚醒方法、裝置、芯片、電子設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202110168131.0 | 申請(qǐng)日: | 2021-02-07 |
| 公開(公告)號(hào): | CN112951243A | 公開(公告)日: | 2021-06-11 |
| 發(fā)明(設(shè)計(jì))人: | 何婷婷;王樂臨;王鑫山;朱虎 | 申請(qǐng)(專利權(quán))人: | 深圳市匯頂科技股份有限公司 |
| 主分類號(hào): | G10L17/00 | 分類號(hào): | G10L17/00;G10L21/0208;G10L25/03;G10L25/18;G10L15/22 |
| 代理公司: | 北京匯思誠業(yè)知識(shí)產(chǎn)權(quán)代理有限公司 11444 | 代理人: | 高飛 |
| 地址: | 518045 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 喚醒 方法 裝置 芯片 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
1.一種語音喚醒方法,應(yīng)用于電子設(shè)備,其特征在于,所述方法包括:
獲取第一音頻信號(hào),所述第一音頻信號(hào)來自佩戴該電子設(shè)備的佩戴者;
判斷所述第一音頻信號(hào)中是否包含語音;
若所述第一音頻信號(hào)包含語音,則開啟身份識(shí)別,以判斷所述佩戴者是否合法的目標(biāo)用戶;
若確定所述佩戴者為合法的目標(biāo)用戶,則進(jìn)行語義識(shí)別,以判斷來自所述佩戴者的音頻信號(hào)是否包含預(yù)設(shè)喚醒詞;
若確定來自所述佩戴者的音頻信號(hào)包含預(yù)設(shè)喚醒詞,則輸出與所述喚醒詞對(duì)應(yīng)的喚醒指令,以使所述電子設(shè)備執(zhí)行所述喚醒指令對(duì)應(yīng)的操作。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取第一音頻信號(hào)包括通過骨傳導(dǎo)傳感器獲取來自佩戴該電子設(shè)備的佩戴者的骨聲紋信號(hào)。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述若所述第一音頻信號(hào)包含語音,則開啟身份識(shí)別,以判斷所述佩戴者是否合法的目標(biāo)用戶,包括:
獲取第二音頻信號(hào),并根據(jù)所述第二音頻信號(hào)判斷所述佩戴者是否合法的目標(biāo)用戶,所述第二音頻信號(hào)為空氣聲紋信號(hào)。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述判斷所述佩戴者是否合法的目標(biāo)用戶包括:
獲取與所述空氣聲紋信號(hào)對(duì)應(yīng)的幀信號(hào);
對(duì)所述幀信號(hào)進(jìn)行降噪,得到增強(qiáng)幀信號(hào);
對(duì)所述增強(qiáng)幀信號(hào)進(jìn)行特征提取,得到空氣聲紋特征;
將所述空氣聲紋特征與目標(biāo)空氣聲紋特征進(jìn)行比較;
若所述空氣聲紋特征與目標(biāo)空氣聲紋特征匹配,則確定所述佩戴者為合法的目標(biāo)用戶。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述方法還包括:
若確定所述佩戴者為合法的目標(biāo)用戶,則根據(jù)所述空氣聲紋特征將空氣聲紋特征與目標(biāo)空氣聲紋特征匹配的判決門限進(jìn)行更新。
6.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述判斷所述第一音頻信號(hào)是否包含語音包括:
獲取所述骨聲紋信號(hào)中的時(shí)域信息和頻譜信息;
對(duì)所述時(shí)域信息和所述頻譜信息進(jìn)行特征提取,得到時(shí)域特征和頻譜特征;
基于所述時(shí)域特征和所述頻譜特征確定所述第一音頻信號(hào)中是否包含語音。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述時(shí)域特征包括時(shí)域能量及過零率,所述頻譜特征包括子帶頻譜能量及基因特征,所述基于所述時(shí)域特征和所述頻譜特征確定所述第一音頻信號(hào)中是否包含語音包括:
將所述第一音頻信號(hào)的時(shí)域能量與預(yù)設(shè)第一時(shí)域能量閾值進(jìn)行比較,若所述第一音頻信號(hào)的時(shí)域能量大于或等于預(yù)設(shè)第一時(shí)域能量閾值,則將所述第一音頻信號(hào)的過零率與預(yù)設(shè)過零率上限及預(yù)設(shè)過零率下限進(jìn)行比較,其中,所述第一時(shí)域能量閾值用于對(duì)所述第一音頻信號(hào)進(jìn)行初步篩選;
若所述第一音頻信號(hào)的過零率小于或等于預(yù)設(shè)過零率上限,且大于或等于預(yù)設(shè)過零率下限,則檢測(cè)所述第一音頻信號(hào)是否存在基因特征;
若所述第一音頻信號(hào)存在所述基因特征,則將所述第一音頻信號(hào)的子帶頻譜能量與與預(yù)設(shè)第二時(shí)域能量閾值進(jìn)行比較,其中,所述第二時(shí)域能量閾值用于對(duì)所述第一音頻信號(hào)進(jìn)行進(jìn)一步篩選,所述第二時(shí)域能量閾值高于所述第一時(shí)域能量閾值;
若所述第一音頻信號(hào)的時(shí)域能量大于或等于預(yù)設(shè)第二時(shí)域能量閾值,
且所述第一音頻信號(hào)的低頻子帶頻譜能量與中頻子帶頻譜能量之間為非預(yù)設(shè)倍數(shù),或所述第一音頻信號(hào)的高頻子帶頻譜能量小于或等于低頻子帶頻譜能量,則確定所述第一音頻信號(hào)中包含語音。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述方法還包括:
若確定所述第一音頻信號(hào)中包含語音,則基于所述第一音頻信號(hào)的時(shí)域能量更新所述預(yù)設(shè)第一時(shí)域能量閾值;和/或
若確定所述第一音頻信號(hào)中包含語音,則基于所述第一音頻信號(hào)的過零率更新所述預(yù)設(shè)過零率上限及所述預(yù)設(shè)過零率下限。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市匯頂科技股份有限公司,未經(jīng)深圳市匯頂科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110168131.0/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





