[發明專利]語音文件修復方法、裝置、計算機設備及存儲介質有效
| 申請號: | 202010990031.1 | 申請日: | 2020-09-18 |
| 公開(公告)號: | CN112071331B | 公開(公告)日: | 2023-05-30 |
| 發明(設計)人: | 羅劍;王健宗;程寧 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G10L25/24 | 分類號: | G10L25/24;G10L25/30;G10L25/51;G10L19/16;G10L19/02 |
| 代理公司: | 深圳市世聯合知識產權代理有限公司 44385 | 代理人: | 汪琳琳 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 文件 修復 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種語音文件修復方法,其特征在于,包括下述步驟:
劃分語音數據為多組幀信號,根據所述幀信號提取所述語音數據的特征系數;
基于預設檢測模型和所述特征系數對所述語音數據的缺失幀進行定位,并確定所述缺失幀在所述語音數據中的組位置為第一組數據;
獲取所述第一組數據的前后組數據,并將所述前后組數據分別作為第二組數據和第三組數據,組合所述第一組數據、所述第二組數據和所述第三組數據為第一修復組,確定所述第一修復組的前一個修復組為第二修復組,獲取所述第二修復組的隱狀態參數;
輸入所述隱狀態參數、所述第一組數據、所述第二組數據和所述第三組數據至預設的第一音頻填充網絡中,計算得到所述缺失幀對應的修復頻譜;
基于預設聲碼器對所述修復頻譜進行處理,得到所述語音數據的修復語音。
2.根據權利要求1所述的語音文件修復方法,其特征在于,所述基于預設檢測模型和所述特征系數對所述語音數據的缺失幀進行定位的步驟包括:
獲取預設檢測模型,所述預設檢測模型包括檢測神經網絡和全連接層,輸入所述特征系數至所述檢測神經網絡中,計算得到檢測值;
輸入所述檢測值至所述全連接層,計算得到輸出結果,根據所述輸出結果對所述語音數據的缺失幀進行定位。
3.根據權利要求2所述的語音文件修復方法,其特征在于,所述獲取預設檢測模型的步驟包括:
獲取預設語料庫中的原始文件,切分所述原始文件為多個幀數據,從所有所述幀數據中隨機抽取預設個數的子幀數據,將所述子幀數據中預設時間段的信號用高斯白噪聲替換,得到替換后的子幀數據,組合所述替換后的子幀數據和未被替換的幀數據為訓練數據集;
根據所述訓練數據集對基礎檢測模型進行訓練,得到訓練成功的基礎檢測模型為所述語音數據的預設檢測模型。
4.根據權利要求1所述的語音文件修復方法,其特征在于,所述獲取所述第二修復組的隱狀態參數的步驟包括:
確定所述第二修復組的前一個修復組為第三修復組,獲取所述第三修復組的元胞狀態;
根據所述元胞狀態和預設的長短期記憶網絡,計算所述第二修復組的隱狀態參數。
5.根據權利要求1所述的語音文件修復方法,其特征在于,所述輸入所述隱狀態參數、所述第一組數據、所述第二組數據和所述第三組數據至預設的第一音頻填充網絡中,計算得到所述缺失幀對應的修復頻譜的步驟包括:
將所述第一組數據和所述第二組數據輸入至預設的第二音頻填充網絡中,計算得到第一中間變量,將所述第二組數據和所述第三組數據輸入至所述第二音頻填充網絡中,計算得到第二中間變量;
輸入所述隱狀態參數、所述第一中間變量和所述第二中間變量至預設的第一音頻填充網絡中,計算得到所述缺失幀對應的修復頻譜,其中,所述第一音頻填充網絡和所述第二音頻填充網絡具有相同的結構和不同的參數。
6.根據權利要求5所述的語音文件修復方法,其特征在于,第二音頻填充網絡包括第一卷積層、第二卷積層和殘差密集網絡,所述將所述第一組數據和所述第二組數據輸入至預設的第二音頻填充網絡中,計算得到第一中間變量的步驟包括:
將所述第一組數據和所述第二組數據輸入至所述第一卷積層計算得到第一參數值;
將所述第一參數值輸入至所述殘差密集網絡,計算得到第二參數值,輸入所述第二參數值至所述第二卷積層得到第一中間變量。
7.根據權利要求1所述的語音文件修復方法,其特征在于,所述劃分語音數據為多組幀信號,根據所述幀信號提取所述語音數據的特征系數的步驟包括:
獲取預設劃分時長,按照所述預設劃分時長將所述語音數據劃分為多組幀信號;
計算每組所述幀信號的梅爾倒譜系數,將所述梅爾倒譜系數作為所述語音數據的特征系數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010990031.1/1.html,轉載請聲明來源鉆瓜專利網。





