[發明專利]語音解碼方法、裝置、引擎及存儲介質在審

申請號：	202010155132.7	申請日：	2020-03-06
公開（公告）號：	CN111402906A	公開（公告）日：	2020-07-10
發明（設計）人：	趙偉偉	申請（專利權）人：	深圳前海微眾銀行股份有限公司
主分類號：	G10L19/008	分類號：	G10L19/008
代理公司：	深圳市世紀恒程知識產權代理事務所 44287	代理人：	王韜
地址：	518000 廣東省深圳市前海深港合作區前***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語音解碼方法裝置引擎存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明公開了一種語音解碼方法、裝置、引擎及存儲介質，所述方法應用于語音解碼引擎，當接收到多個語音解碼請求時，申請多個線程級解碼通道，所述多個語音解碼請求與所述多個線程級解碼通道一一對應；利用所述多個線程級解碼通道分別調用通用模型，對所述多個語音解碼請求中的語音流數據進行并行解碼處理，獲得解碼結果，并基于所述解碼結果響應所述多個語音解碼請求。由此，通過多個線程級解碼通道并行處理多個語音解碼請求，請求多個線程級解碼通道共用一個通用模型，實現了語音解碼的線程級的并行處理，降低了硬件成本，提高了語音解碼的并發能力和解碼效率。

技術領域

本發明涉及語音識別技術領域，尤其涉及一種語音解碼方法、裝置、引擎及存儲介質。

背景技術

隨著計算機技術的發展，越來越多的技術(大數據、分布式、區塊鏈Blockchain、人工智能等)應用在金融領域，傳統金融業正在逐步向金融科技(Fintech)轉變，但由于金融行業的安全性、實時性要求，也對技術提出了更高的要求。

語音解碼是語音識別的重要組成部分。當前，一般基于通用模型對語音流數據進行解碼獲得該語音流數據對應的文本。若需要實現并行處理提高語音解碼效率，則只能在進程級別通過部署更多的通用模型來實現，但是通用模型體積大，如此大大提升了硬件成本。

發明內容

本發明提供一種語音解碼方法、裝置、引擎及存儲介質，旨在創建多個解碼通道共用一個通用模型，實現線程級別的并行處理，降低硬件成本，提高語音解碼的并發能力和解碼效率。

為實現上述目的，本發明提供一種語音解碼方法，所述方法包括：

當接收到多個語音解碼請求時，申請多個線程級解碼通道，所述多個語音解碼請求與所述多個線程級解碼通道一一對應；

利用所述多個線程級解碼通道分別調用通用模型，對所述多個語音解碼請求中的語音流數據進行并行解碼處理，獲得解碼結果，并基于所述解碼結果響應所述多個語音解碼請求。

優選地，所述線程級解碼通道包括通道解碼單元、數據緩存區和回調接口單元；

所述利用所述多個線程級解碼通道分別調用通用模型，對所述多個語音解碼請求中的語音流數據進行并行解碼處理，獲得解碼結果，并基于所述解碼結果響應所述多個語音解碼請求的步驟包括：