[發明專利]語音內容的處理方法、裝置、設備及可讀存儲介質在審
| 申請號: | 202110276346.4 | 申請日: | 2021-03-15 |
| 公開(公告)號: | CN113066508A | 公開(公告)日: | 2021-07-02 |
| 發明(設計)人: | 李晉;馬龍;張力;張曉明 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G10L25/03 | 分類號: | G10L25/03;G10L25/30;G10L15/02;G10L15/16;G10L15/18 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 祝亞男 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 內容 處理 方法 裝置 設備 可讀 存儲 介質 | ||
本申請公開了一種語音內容的處理方法、裝置、設備及可讀存儲介質,涉及機器學習領域。該方法包括:獲取語音內容;對語音內容進行特征提取,得到第一數據格式的音頻特征;對音頻特征進行動態量化得到第二數據格式的量化特征,第一數據格式的數據位數大于第二數據格式的數據位數;將量化特征輸入至語音處理模型,輸出得到內容處理結果。通過將語音處理模型中的模型參數從第一數據格式量化至第二數據格式,且在進行音頻特征處理之前首先將音頻特征量化至第二數據格式,由于第一數據格式的數據位數大于第二數據格式的數據位數,從而減小了語音處理模型整體的數據占用量,減小了語音處理模型在移動設備中的外存(如flash)和內存占用情況。
技術領域
本申請實施例涉及機器學習領域,特別涉及一種語音內容的處理方法、裝置、設備及可讀存儲介質。
背景技術
隨著機器學習領域的快速發展,對于在移動設備端使用離線神經網絡的需求增大,如:在離線場景下,使用移動設備端的神經網絡模型進行語音檢測,從而對移動設備進行喚醒,而神經網絡算法的發展導致神經網絡對計算和內存的要求越來越大,以至于移動設備的計算能力和內存空間無法承受。
相關技術中,以語音識別場景為例,通常利用神經網絡TensorFlow和Pytorch框架訓練聲學模型,嵌入到語音框架Kaldi中,從而實現對聲學模型的量化。
然而,上述方式的實現成本較大,TensorFlow和Pytorch框架缺少語音解碼器相關的技術,即使融合到語音框架Kaldi中,由于融合了兩種框架,勢必內存占用會增加,改造、維護成本也較大。
發明內容
本申請實施例提供了一種語音內容的處理方法、裝置、設備及可讀存儲介質,能夠加速神經網絡對語音內容處理的推理速度,降低中央處理器(Central Processing Unit,CPU)占用,并減小移動設備端語音處理模型的內存占用。所述技術方案如下:
一方面,提供了一種語音內容的處理方法,所述方法包括:
獲取語音內容,所述語音內容為待處理的內容;
對所述語音內容進行特征提取,得到音頻特征,所述音頻特征對應第一數據格式;
對所述音頻特征進行動態量化處理后得到量化特征,所述量化特征對應第二數據格式,所述第一數據格式對應的數據位數大于所述第二數據格式對應的數據位數;
將所述量化特征輸入至語音處理模型,輸出得到內容處理結果,所述語音處理模型中包括第一模型參數,所述第一模型參數對應所述第二數據格式,所述第一模型參數是由第二模型參數經過量化得到的參數,所述第二模型參數對應所述第一數據格式。
另一方面,提供了一種語音內容的處理裝置,所述裝置包括:
獲取模塊,用于獲取語音內容,所述語音內容為待處理的內容;
提取模塊,用于對所述語音內容進行特征提取,得到音頻特征,所述音頻特征對應第一數據格式;
處理模塊,用于對所述音頻特征進行動態量化處理后得到量化特征,所述量化特征對應第二數據格式,所述第一數據格式對應的數據位數大于所述第二數據格式對應的數據位數;
所述處理模塊,還用于將所述量化特征輸入至語音處理模型,輸出得到內容處理結果,所述語音處理模型中包括第一模型參數,所述第一模型參數對應所述第二數據格式,所述第一模型參數是由第二模型參數經過量化得到的參數,所述第二模型參數對應所述第一數據格式。
另一方面,提供了一種計算機設備,所述計算機設備包括處理器和存儲器,所述存儲器中存儲有至少一段程序,所述至少一段程序由所述處理器加載并執行以實現如上述本申請實施例中任一所述的語音內容的處理方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110276346.4/2.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





