[發明專利]連續語音指令快速識別控制系統在審
| 申請號: | 202210347366.0 | 申請日: | 2022-04-01 |
| 公開(公告)號: | CN114664303A | 公開(公告)日: | 2022-06-24 |
| 發明(設計)人: | 陳芒 | 申請(專利權)人: | 深圳市輕生活科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/16;G10L15/06;G10L21/0208;G10L25/78 |
| 代理公司: | 北京冠和權律師事務所 11399 | 代理人: | 趙銀萍 |
| 地址: | 518000 廣東省深圳市福田區福田*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 連續 語音 指令 快速 識別 控制系統 | ||
本發明提供連續語音指令快速識別控制系統,包括:輸入模塊與預處理模塊連接,通過MIC輸入用戶控制語音;預處理模塊的另一端分別與在線語音識別處理模塊、離線語音識別處理模塊連接,對用戶控制語音進行音頻預處理;在線語音識別處理模塊通過云端平臺對預處理后的語音進行語音識別得到語音輸出信息;離線語音識別處理模塊通過神經網絡RNN模型對預處理后的語音進行語音識別得到語音輸出信息;輸出模塊將在線語音識別處理模塊或離線語音識別處理模塊得到的語音輸出信息輸出。本發明通過在線語音識別處理模塊和離線語音識別處理模塊消除了是否在線的限制,使得離線狀態也能夠進行語音指令識別,而且還能夠快速穩定地針對連續的語音指令進行識別。
技術領域
本發明涉及智能控制技術領域,特別涉及一種連續語音指令快速識別控制 系統。
背景技術
隨著計算機的普及和越來越多的智能設備出現,怎么跟這些設備之間建立 一個簡單直接的溝通方式成了人們迫切的需求,語音識別技術的出現讓人們的 這種需求從夢想變成了現實,實現可以跟機器就行語音交流,語音識別,通常 稱為自動語音識別,主要是將人類語音中的詞匯內容轉換為計算機可讀的輸入。
目前,在線語音識別普遍都存在著網絡不穩定、回饋延時大等問題,離線 語音識別的出現則擺脫了對網絡的依賴,但是單次只能識別一條單一的指令, 大大的影響了用戶使用產品的體驗感,因此,本發明給出了一種連續語音指令 快速識別控制系統,通過在線語音識別處理模塊和離線語音識別處理模塊消除 了是否在線的限制,使得離線狀態也能夠進行語音指令識別,而且還能夠快速 穩定地針對連續的語音指令進行識別。
發明內容
本發明提供了連續語音指令快速識別控制系統,運用神經網絡RNN,解決 現有技術方案中單次只能識別一條單一指令的問題。
本發明提供一種連續語音指令快速識別控制系統,包括:一種連續語音指 令快速識別控制系統,其特征在于,包括:輸入模塊、預處理模塊、在線語音 識別處理模塊、離線語音識別處理模塊和輸出模塊;
所述輸入模塊與所述預處理模塊連接,用于通過MIC輸入用戶控制語音;
所述預處理模塊的另一端分別與所述在線語音識別處理模塊、離線語音識 別處理模塊連接,用于對所述用戶控制語音進行音頻預處理,得到預處理后的 語音;
所述在線語音識別處理模塊,用于通過云端平臺對預處理后的語音進行語 音識別得到語音輸出信息;
所述離線語音識別處理模塊,用于通過神經網絡RNN模型對預處理后的語 音進行語音識別得到語音輸出信息;
所述輸出模塊,用于將所述在線語音識別處理模塊或所述離線語音識別處 理模塊得到的語音輸出信息輸出。
優選的,所述連續語音指令快速識別控制系統還包括:喚醒模塊;當所述 連續語音指令快速識別控制系統在預設時間內未收到用戶控制語音時,所述連 續語音指令快速識別控制系統進入休眠狀態,當再次使用所述連續語音指令快 速識別控制系統時,通過所述喚醒模塊,利用特定喚醒詞將處于休眠狀態的連 續語音指令快速識別控制系統喚醒進入待命狀態。
優選的,所述MIC采用線性雙麥克風陣列,所述預處理模塊在對所述用戶 控制語音進行音頻預處理時包括:
通過AD芯片對所述MIC輸入的用戶控制語音進行采集,獲得所述用戶控 制語音;
對所述用戶控制語音進行分幀處理,將所述用戶控制語音按幀劃分,獲得 多個用戶控制語音幀;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市輕生活科技有限公司,未經深圳市輕生活科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210347366.0/2.html,轉載請聲明來源鉆瓜專利網。





