[發明專利]語音識別方法及裝置在審
| 申請號: | 202110995270.0 | 申請日: | 2021-08-27 |
| 公開(公告)號: | CN113707152A | 公開(公告)日: | 2021-11-26 |
| 發明(設計)人: | 王林霄 | 申請(專利權)人: | 上海嗶哩嗶哩科技有限公司 |
| 主分類號: | G10L15/34 | 分類號: | G10L15/34;G10L15/26;G10L15/04;G10L15/05;G10L25/51 |
| 代理公司: | 北京英特普羅知識產權代理有限公司 11015 | 代理人: | 鄧小玲;王勇 |
| 地址: | 200433 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 裝置 | ||
本申請公開了一種語音識別方法。該方法包括:接收語音識別請求,所述語音識別請求包括待識別語音;確定所述待識別語音的語音長度;采用與所述語音長度相匹配的語音識別方式對所述待識別語音進行語音識別,得到語音識別結果。本申請可減少語音識別所需時間。
技術領域
本申請涉及語音識別技術領域,尤其涉及一種語音識別方法及裝置。
背景技術
自動語音識別(Automatic Speech Recognition,ASR)是一種可以把人類的語音音頻信號轉換為文本內容的技術。隨著軟硬件技術的發展,各種智能設備的計算能力和存儲容量有了很大進步,使得語音識別技術在智能設備中得以廣泛應用。
然而,發明人發現,現有的語音識別技術在對語音進行識別的過程中,不管是針對長語音的識別還是短語音的識別,在識別的過程中,其采用的識別流程基本一致,導致在針對一些較長的語音進行識別時也需要花費比較長的時間才能得到語音識別結果。
發明內容
有鑒于此,現提供一種語音識別方法、裝置、計算機設備及計算機可讀存儲介質,以解決現有的語音識別方法在針對一些較長的語音進行識別時也需要花費比較長的時間才能得到語音識別結果的問題。
本申請提供了一種語音識別方法,所述方法包括:
接收語音識別請求,所述語音識別請求包括待識別語音;
確定所述待識別語音的語音長度;
采用與所述語音長度相匹配的語音識別方式對所述待識別語音進行語音識別,得到語音識別結果。
可選地,所述采用與所述語音長度相匹配的語音識別方式對所述待識別語音進行語音識別,得到語音識別結果包括:
在所述語音長度小于或者等于第一預設長度時,采用第一語音識別方式對所述待識別語音進行語音識別,得到語音識別結果;
在所述語音長度大于所述第一預設長度且小于或者等于第二預設長度時,采用第二語音識別方式對所述待識別語音進行語音識別,得到語音識別結果;
在所述語音長度大于所述第二預設長度時,采用第三語音識別方式對所述待識別語音進行語音識別,得到語音識別結果。
可選地,所述采用第一語音識別方式對所述待識別語音進行語音識別,得到語音識別結果包括:
通過預設的語音任務管理模塊根據所述待識別語音創建第一語音識別任務;
通過所述語音任務管理模塊調用預設的語音識別模塊根據所述第一語音識別任務對所述待識別語音進行語音識別,得到語音識別結果。
可選地,所述采用第二語音識別方式對所述待識別語音進行語音識別,得到語音識別結果包括:
通過所述語音任務管理模塊同步調用預設的語音活動檢測模塊對所述待識別語音進行端點檢測,得到端點檢測結果,所述端點檢測結果包括所述待識別語音可劃分的多個短語音的時間偏移量;
通過所述語音任務管理模塊根據所述端點檢測結果將所述待識別語音中可劃分的多個短語音分為多個分組,每一個分組包括至少一個短語音的時間偏移量;
通過所述語音任務管理模塊創建多個第二語音識別任務,并將多個第二語音識別任務存儲至隊列中,每一個第二語音識別任務對應一個分組所包含的短語音;
通過所述語音識別模塊中的多個語音識別實例從所述隊列中獲取所述第二語音識別任務,其中,每一個語音識別實例用于處理一個第二語音識別任務;
通過所述語音識別模塊中的多個語音識別實例并行根據獲取到的第二語音識別任務對對應分組中包含的短語音進行語音識別,得到語音識別結果;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海嗶哩嗶哩科技有限公司,未經上海嗶哩嗶哩科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110995270.0/2.html,轉載請聲明來源鉆瓜專利網。





