[發明專利]語音解碼方法、裝置、引擎及存儲介質在審
| 申請號: | 202010155132.7 | 申請日: | 2020-03-06 |
| 公開(公告)號: | CN111402906A | 公開(公告)日: | 2020-07-10 |
| 發明(設計)人: | 趙偉偉 | 申請(專利權)人: | 深圳前海微眾銀行股份有限公司 |
| 主分類號: | G10L19/008 | 分類號: | G10L19/008 |
| 代理公司: | 深圳市世紀恒程知識產權代理事務所 44287 | 代理人: | 王韜 |
| 地址: | 518000 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 解碼 方法 裝置 引擎 存儲 介質 | ||
本發明公開了一種語音解碼方法、裝置、引擎及存儲介質,所述方法應用于語音解碼引擎,當接收到多個語音解碼請求時,申請多個線程級解碼通道,所述多個語音解碼請求與所述多個線程級解碼通道一一對應;利用所述多個線程級解碼通道分別調用通用模型,對所述多個語音解碼請求中的語音流數據進行并行解碼處理,獲得解碼結果,并基于所述解碼結果響應所述多個語音解碼請求。由此,通過多個線程級解碼通道并行處理多個語音解碼請求,請求多個線程級解碼通道共用一個通用模型,實現了語音解碼的線程級的并行處理,降低了硬件成本,提高了語音解碼的并發能力和解碼效率。
技術領域
本發明涉及語音識別技術領域,尤其涉及一種語音解碼方法、裝置、引擎及存儲介質。
背景技術
隨著計算機技術的發展,越來越多的技術(大數據、分布式、區塊鏈Blockchain、人工智能等)應用在金融領域,傳統金融業正在逐步向金融科技(Fintech)轉變,但由于金融行業的安全性、實時性要求,也對技術提出了更高的要求。
語音解碼是語音識別的重要組成部分。當前,一般基于通用模型對語音流數據進行解碼獲得該語音流數據對應的文本。若需要實現并行處理提高語音解碼效率,則只能在進程級別通過部署更多的通用模型來實現,但是通用模型體積大,如此大大提升了硬件成本。
發明內容
本發明提供一種語音解碼方法、裝置、引擎及存儲介質,旨在創建多個解碼通道共用一個通用模型,實現線程級別的并行處理,降低硬件成本,提高語音解碼的并發能力和解碼效率。
為實現上述目的,本發明提供一種語音解碼方法,所述方法包括:
當接收到多個語音解碼請求時,申請多個線程級解碼通道,所述多個語音解碼請求與所述多個線程級解碼通道一一對應;
利用所述多個線程級解碼通道分別調用通用模型,對所述多個語音解碼請求中的語音流數據進行并行解碼處理,獲得解碼結果,并基于所述解碼結果響應所述多個語音解碼請求。
優選地,所述線程級解碼通道包括通道解碼單元、數據緩存區和回調接口單元;
所述利用所述多個線程級解碼通道分別調用通用模型,對所述多個語音解碼請求中的語音流數據進行并行解碼處理,獲得解碼結果,并基于所述解碼結果響應所述多個語音解碼請求的步驟包括:
利用所述多個線程級解碼通道的數據緩存區分別緩存所述多個語音解碼請求中的語音流數據;
利用所述多個線程級解碼通道的通道解碼單元,分別調用通用模型,對所述多個語音解碼請求中的語音流數據進行并行解碼處理,獲得解碼結果;
利用所述多個線程級解碼通道的回調接口單元基于所述解碼結果分別響應所述多個語音解碼請求。
優選地,所述利用所述多個線程級解碼通道的數據緩存區分別緩存所述多個語音解碼請求中的語音流數據,包括:
針對所述多個線程級解碼通道中任一特定線程級解碼通道,查看所述特定線程級解碼通道的數據緩存區的數據狀態;
若所述特定線程級解碼通道的數據緩存區的數據狀態是等待數據,則直接將所述特定線程級解碼通道對應的語音流數據暫存在所述特定線程級解碼通道的數據緩存區;
若所述特定線程級解碼通道的數據緩存區的數據狀態是有數據,則將所述特定線程級解碼通道對應的語音流數據暫存在所述特定線程級解碼通道的數據緩存區的末尾。
優選地,所述利用所述多個線程級解碼通道的通道解碼單元,分別調用通用模型,對所述多個語音解碼請求中的語音流數據進行并行解碼處理,獲得解碼結果的步驟包括:
利用所述多個線程級解碼通道的通道解碼單元,分別調用通用模型;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳前海微眾銀行股份有限公司,未經深圳前海微眾銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010155132.7/2.html,轉載請聲明來源鉆瓜專利網。





