[發(fā)明專利]多級識別語音喚醒方法及裝置、計算機存儲介質(zhì)及設(shè)備在審
| 申請?zhí)枺?/td> | 201811375859.5 | 申請日: | 2018-11-19 |
| 公開(公告)號: | CN111199733A | 公開(公告)日: | 2020-05-26 |
| 發(fā)明(設(shè)計)人: | 余志軍;王青松;劉濤 | 申請(專利權(quán))人: | 珠海全志科技股份有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/26;G10L25/51;G10L25/78 |
| 代理公司: | 工業(yè)和信息化部電子專利中心 11010 | 代理人: | 連鵬飛 |
| 地址: | 519085 廣東省*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 多級 識別 語音 喚醒 方法 裝置 計算機 存儲 介質(zhì) 設(shè)備 | ||
1.一種多級識別語音喚醒方法,其特征在于,該方法包括:
利用語音活動檢測單元判斷聲音數(shù)據(jù)中是否存在語音;
根據(jù)判斷結(jié)果決定是否喚醒協(xié)處理器;
根據(jù)所述協(xié)處理器的關(guān)鍵詞匹配結(jié)果確定是否喚醒主處理器。
2.如權(quán)利要求1所述的多級識別語音喚醒方法,其特征在于,利用語音活動檢測單元判斷聲音數(shù)據(jù)中是否存在語音的步驟之前,該方法還包括:
利用拾音接口采集周圍環(huán)境的聲音數(shù)據(jù),并存儲至第一存儲器;
利用聲音觸發(fā)單元判斷所述聲音數(shù)據(jù)的能量;
如果所述能量大于第一閾值,喚醒所述語音活動檢測單元;
如果所述能量小于等于所述第一閾值,繼續(xù)利用拾音接口采集周圍環(huán)境的聲音數(shù)據(jù)。
3.如權(quán)利要求2所述的多級識別語音喚醒方法,其特征在于,利用語音活動檢測單元判斷聲音數(shù)據(jù)中是否存在語音的步驟,具體包括:
所述語音活動檢測單元被喚醒后從所述第一存儲器讀取所述聲音數(shù)據(jù);
判斷所述聲音數(shù)據(jù)中是否存在語音。
4.如權(quán)利要求3所述的多級識別語音喚醒方法,其特征在于,根據(jù)檢測結(jié)果決定是否喚醒協(xié)處理器的步驟,具體包括:
如果所述聲音數(shù)據(jù)中存在語音,則喚醒協(xié)處理器,同時所述語音活動檢測單元進入低功耗模式;
如果所述聲音數(shù)據(jù)中不存在語音,則所述語音活動檢測單元進入低功耗模式,等待被所述聲音觸發(fā)單元喚醒。
5.如權(quán)利要求4所述的多級識別語音喚醒方法,其特征在于,根據(jù)所述協(xié)處理器的關(guān)鍵詞匹配結(jié)果確定是否喚醒主處理器的步驟,具體包括:
所述協(xié)處理器被喚醒后從所述第一存儲器讀取所述聲音數(shù)據(jù);
對所述聲音數(shù)據(jù)進行關(guān)鍵詞匹配;
統(tǒng)計預(yù)設(shè)時間內(nèi)的匹配成功數(shù)及匹配成功率;
如果所述匹配成功數(shù)小于第二閾值或者所述匹配成功率小于第三閾值,則所述協(xié)處理器進入低功耗模式,等待被所述語音活動檢測單元喚醒;
如果所述匹配成功數(shù)大于等于所述第二閾值并且所述匹配成功率大于等于所述第三閾值,則喚醒主處理器,并切換所述聲音數(shù)據(jù)的存儲位置為第二存儲器,所述協(xié)處理器進入低功耗模式。
6.如權(quán)利要求5所述的多級識別語音喚醒方法,其特征在于,對所述聲音數(shù)據(jù)進行關(guān)鍵詞匹配之前,還包括:
對所述聲音數(shù)據(jù)進行降噪處理。
7.如權(quán)利要求5或6所述的多級識別語音喚醒方法,其特征在于,根據(jù)所述協(xié)處理器的關(guān)鍵詞匹配結(jié)果確定是否喚醒主處理器的步驟之后,該方法還包括:
所述主處理器被喚醒后從所述第二存儲器讀取所述聲音數(shù)據(jù);
對所述聲音數(shù)據(jù)進行語義識別;
語義識別完成后,并切換所述聲音數(shù)據(jù)的存儲位置為第一存儲器,所述主處理器進入低功耗模式。
8.一種包含計算機執(zhí)行指令的計算機存儲介質(zhì),所述計算機執(zhí)行指令經(jīng)由數(shù)據(jù)處理設(shè)備處理時,該數(shù)據(jù)處理設(shè)備執(zhí)行權(quán)利要求1~7任一所述的多級識別語音喚醒方法。
9.一種運行計算機存儲介質(zhì)的計算機設(shè)備,所述計算機設(shè)備運行權(quán)利要求8所述的計算機存儲介質(zhì)時,該計算機設(shè)備執(zhí)行多級識別語音喚醒方法。
10.一種多級識別語音喚醒裝置,其特征在于,該裝置包括:
拾音接口(10),用于采集周圍環(huán)境的聲音數(shù)據(jù);
第一存儲器(20),與所述拾音接口(10)連接,用于存儲所述拾音接口(10)采集的所述聲音數(shù)據(jù);
聲音觸發(fā)單元(30),與所述拾音接口(10)連接,用于判斷所述聲音數(shù)據(jù)的能量;
語音活動檢測單元(40),與所述聲音觸發(fā)單元(30)和所述第一存儲器(20)連接,用于被所聲音觸發(fā)單元(30)喚醒后檢測所述聲音數(shù)據(jù)中是否存在語音;
協(xié)處理器(50),與所述語音活動檢測單元(40)連接,用于被所述語音活動檢測單元(40)喚醒后對所述聲音數(shù)據(jù)進行關(guān)鍵詞匹配;
主處理器(60),通過總線(B)與所述第一存儲器(20)和所述協(xié)處理器(50)連接,用于被所述協(xié)處理器(50)喚醒后對所述聲音數(shù)據(jù)進行語義識別;
第二存儲器(70),與所述總線(B)連接,用于所述主處理器(60)被喚醒后存儲所述聲音數(shù)據(jù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于珠海全志科技股份有限公司,未經(jīng)珠海全志科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811375859.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種flowlet負載分擔方法及裝置
- 下一篇:隱蔽通信方法和設(shè)備





