[發明專利]低功率、始終監聽的語音命令檢測及捕獲在審
| 申請號: | 201780086471.0 | 申請日: | 2017-12-20 |
| 公開(公告)號: | CN110520927A | 公開(公告)日: | 2019-11-29 |
| 發明(設計)人: | X.趙;A.C.斯坦格;S.奧康納;A.哈迪亞沙爾 | 申請(專利權)人: | 愛浮諾亞股份有限公司 |
| 主分類號: | G10L25/78 | 分類號: | G10L25/78;G10L15/22 |
| 代理公司: | 11105 北京市柳沈律師事務所 | 代理人: | 于小寧<國際申請>=PCT/US2017 |
| 地址: | 美國俄*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數字音頻信號 中斷信號 閾值時 語音活動檢測器 頻譜分析 語音命令 捕獲 檢測 配置 | ||
一種用于檢測和捕獲語音命令的系統,該系統包括語音活動檢測器(VAD),VAD被配置為:接收VAD接收的數字音頻信號;確定VAD接收的數字音頻信號的幅度;將VAD接收的數字音頻信號的幅度與第一閾值和第二閾值進行比較;當VAD接收的數字音頻信號的幅度不超過第一閾值或第二閾值時,不給出VAD中斷信號;當VAD接收的數字音頻信號的幅度超過第一閾值和第二閾值時,生成VAD中斷信號;并且當VAD接收的數字音頻信號的幅度在第一閾值和第二閾值之間時,對VAD接收的數字音頻信號進行頻譜分析。
技術領域
本公開針對用于語音命令的語音檢測及捕獲的系統和方法。
背景技術
許多消費電子設備具有通過由人類語音發出的語音命令來全部或部分地控制的功能。該語音控制允許用戶在不使用用戶的手并且設備上的按鈕或開關更少的情況下操作設備。
這樣的設備可能需要始終監聽(always-listening)模式,以便設備可以“聽到”并捕獲語音命令。因此,在始終監聽模式下,設備開啟并等待語音命令。始終監聽功能的質量通常通過兩個指標來衡量:總體平均電流消耗和語音命令誤檢測率。
本發明的實施例解決了現有設備中的缺陷。
發明內容
所公開主題的實施例針對低功率、始終監聽的語音命令檢測和捕獲系統。通過利用較低電流操作狀態,該系統可以減少系統的總體平均電流消耗。在最低電流操作狀態下,系統等待語音活動的跡象。每個隨后的狀態具有逐漸更高的語音命令檢測置信度,直到檢測、識別和處理語音命令的最高電流操作狀態。
相應地,用于檢測和捕獲語音命令的系統的至少一些實施例可以包括語音活動檢測器(VAD),其被配置為:接收VAD接收的數字音頻信號;確定VAD接收的數字音頻信號的幅度;將VAD接收的數字音頻信號的幅度與第一閾值和第二閾值進行比較;當VAD接收的數字音頻信號的幅度不超過第一閾值或第二閾值時,不給出VAD中斷信號;當VAD接收的數字音頻信號的幅度超過第一閾值和第二閾值時,生成VAD中斷信號;并且當VAD接收的數字音頻信號的幅度在第一閾值和第二閾值之間時,對VAD接收的數字音頻信號進行頻譜分析。
在另一方面,檢測和捕獲語音命令的方法的至少一些實施例可以包括:由語音活動檢測器(VAD)接收VAD接收的數字音頻信號;由VAD確定VAD接收的數字音頻信號的幅度;由VAD將VAD接收的數字音頻信號的幅度與第一閾值和第二閾值進行比較;當VAD接收的數字音頻信號的幅度不超過第一閾值或第二閾值時,VAD不給出VAD中斷信號;當VAD接收的數字音頻信號的幅度超過第一閾值和第二閾值時,由VAD生成VAD中斷信號;并且當VAD接收的數字音頻信號的幅度在第一閾值和第二閾值之間時,由VAD對VAD接收的數字音頻信號進行頻譜分析。
相應地,當與現有設備相比時,所描述的系統和方法可以在較低的平均電流消耗下提供較低的語音命令誤檢測率。
附圖說明
圖1是根據本發明實施例的語音命令檢測和捕獲系統的功能框圖。
圖2是可以被包括在圖1所示的語音識別模塊中的喚醒電路的電路圖。
圖3示出了來自人類言語的音頻信號的示例圖,其中縱軸表示信號幅度,并且橫軸表示時間。
圖4是示出圖1所示的語音識別模塊的示例過程的流程圖。
圖5示出了根據語音命令檢測和捕獲系統的特征的時鐘切換事件的示例。
在以下詳細描述中,圖案的參考標記1xx一般在圖1和圖2中示出,而3xx參考標記一般在圖3中示出。同樣,4xx參考標記一般在圖4中示出,并且5xx參考標記一般在圖5中示出。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于愛浮諾亞股份有限公司,未經愛浮諾亞股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780086471.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:在廣域內收集聲音而不損失聲音的裝置及其使用方法
- 下一篇:存儲設備的初始化





