[發明專利]流式語音識別的處理方法、裝置和計算機設備有效
| 申請號: | 202111054122.5 | 申請日: | 2021-09-09 |
| 公開(公告)號: | CN113506575B | 公開(公告)日: | 2022-02-08 |
| 發明(設計)人: | 李杰;王廣新;楊漢丹 | 申請(專利權)人: | 深圳市友杰智新科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/06;G10L19/022 |
| 代理公司: | 深圳市明日今典知識產權代理事務所(普通合伙) 44343 | 代理人: | 王杰輝 |
| 地址: | 518000 廣東省深圳市南山*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 處理 方法 裝置 計算機 設備 | ||
本申請提供了一種流式語音識別的處理方法、裝置和計算機設備,識別系統采集初始語音數據,對初始語音數據進行一次滑窗處理,得到若干個二次語音數據。再按照各個二次語音數據的采集時間順序,依次將各個二次語音數據輸入預先訓練的語音識別模型進行處理,得到各個初始序列矩陣。每次語音識別模型輸出新的初始序列矩陣時,識別系統將當前時刻的初始序列矩陣與預設數量個相鄰上一時刻的初始序列矩陣進行拼接,得到二次序列矩陣。在每次得到新的二次序列矩陣時,對二次序列矩陣進行二次滑窗處理,得到最終序列矩陣。識別系統調用識別算法在所述最終序列矩陣上進行搜索,獲得識別結果,處理速度快,準確度高。
技術領域
本申請涉及語音識別技術領域,特別涉及一種流式語音識別的處理方法、裝置和計算機設備。
背景技術
喚醒詞、命令詞識別屬于語音識別領域,廣泛應用于智能家居、智能終端等場景?,F有喚醒詞、命令詞模型在應用時,實時檢測用戶的語音,當檢測到特定詞匯時,即做出反饋。如何在流式語音數據中精準檢測出特定詞匯,除了跟算法的性能相關外,流式處理的算法也至關重要。比如常見的流式處理會選取固定的窗長,然后按照一定的步長進行滑動。這樣的處理方式存在如下缺點:
一是設置了固定的窗口長度,從而限定了檢測的范圍。比如窗口長度設定為2s,也就是說喚醒詞、命令詞要在2s內說完,才能準確檢測。對于語速慢的用戶,超過2s很容易就沒法識別,降低了用戶體驗;
二是步長的選擇需要精心設計,如果步長太大容易漏檢測,太小則會增加處理頻率,延時增加,實時反饋時間變長,用戶體驗變差;
三是輸入端的overlap(重疊)處理,比如窗口長度是3s,步長stride=1s,第一次處理的是1-3s數據,第2次處理的是2-4s數據,第一個窗口和第二個窗口中間有重疊,而非完全不相交。單位處理的時間為模型推理和后處理時間的總和,而模型推理一般是整個算法運行時間的主要部分,大大限制了步長的可選范圍。步長設定小了,延時嚴重,設定大了,漏識別會大大增加。
發明內容
本申請的主要目的為提供一種流式語音識別的處理方法、裝置和計算機設備,旨在解決現有流式語音數據的處理方法延時較為嚴重或者漏識別幾率較大的弊端。
為實現上述目的,本申請提供了一種流式語音識別的處理方法,包括:
采集初始語音數據;
對所述初始語音數據進行一次滑窗處理,得到若干個二次語音數據;
按照各所述二次語音數據的采集時間順序,依次將各所述二次語音數據輸入預先訓練的語音識別模型進行處理,得到各所述二次語音數據分別對應的初始序列矩陣;
每次所述語音識別模型輸出新的初始序列矩陣時,將當前時刻的初始序列矩陣與預設數量個相鄰上一時刻的初始序列矩陣進行拼接,得到二次序列矩陣;
在每次得到新的二次序列矩陣時,對所述二次序列矩陣進行二次滑窗處理,得到最終序列矩陣,其中,所述二次滑窗處理時窗口長度與預設命令詞長度對應,且相鄰窗口之間不做重疊;
調用識別算法在所述最終序列矩陣上進行搜索,獲得識別結果。
本申請還提供了一種流式語音識別的處理裝置,包括:
采集模塊,用于采集初始語音數據;
第一滑窗模塊,用于對所述初始語音數據進行一次滑窗處理,得到若干個二次語音數據;
識別模塊,用于按照各所述二次語音數據的采集時間順序,依次將各所述二次語音數據輸入預先訓練的語音識別模型進行處理,得到各所述二次語音數據分別對應的初始序列矩陣;
拼接模塊,用于每次所述語音識別模型輸出新的初始序列矩陣時,將當前時刻的初始序列矩陣與預設數量個相鄰上一時刻的初始序列矩陣進行拼接,得到二次序列矩陣;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市友杰智新科技有限公司,未經深圳市友杰智新科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111054122.5/2.html,轉載請聲明來源鉆瓜專利網。





