[發明專利]音頻數據處理方法、裝置、計算機設備及存儲介質在審
| 申請號: | 202010718661.3 | 申請日: | 2020-07-23 |
| 公開(公告)號: | CN111883147A | 公開(公告)日: | 2020-11-03 |
| 發明(設計)人: | 張旭;鄭羲光;張晨 | 申請(專利權)人: | 北京達佳互聯信息技術有限公司 |
| 主分類號: | G10L19/005 | 分類號: | G10L19/005;G10L19/02 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 寧立存 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 數據處理 方法 裝置 計算機 設備 存儲 介質 | ||
本公開關于一種音頻數據處理方法、裝置、計算機設備及存儲介質,涉及音頻數據處理領域。通過在音頻文件丟幀時,從音頻文件中獲取丟幀時刻之前的多個音頻幀,由于這多個音頻幀的音頻信息與丟失音頻幀具有較強的關聯性,則可以根據這些音頻幀所包含的信息,來確定丟幀時刻的目標幅度值和目標相位,再基于該目標幅度值和目標相位,也即是,基于幅度和相位兩個維度的數據,來構造丟幀時刻對應的目標音頻幀,從而可以有效提高音頻幀恢復的準確率。
技術領域
本公開涉及音頻數據處理領域,尤其涉及音頻數據數據處理方法、裝置、計算機設備及存儲介質。
背景技術
隨著移動通信和互聯網的發展,音頻技術的應用越來越廣泛。在音頻數據的傳輸過程中,由于網絡環境較差等原因,可能會發生丟幀事件,嚴重影響音頻質量。目前,在音頻數據處理過程中,發生丟幀事件時,通常是基于丟失音頻幀的前一個音頻幀對應的激勵參數,來構造丟失音頻幀。當出現連續丟幀,即連續多個音頻幀丟失時,則需要基于前一個音頻幀對應的激勵參數,來恢復出多個丟失的音頻幀。
但是,在上述過程中,由于該前一個音頻幀的激勵參數往往與后續丟失的多個音頻幀關聯性較差,會導致難以準確地預測出丟失音頻幀所包含的信息,音頻幀恢復效果較差。因此,在進行音頻數據處理時,如何準確地恢復出丟失的音頻幀,是當前的一個重要研究方向。
發明內容
本公開提供一種音頻數據處理方法、裝置、計算機設備及計算機可讀存儲介質,可以在音頻數據處理過程中,準確恢復出丟失的音頻幀。本公開的技術方案如下:
根據本公開實施例的第一方面,提供一種音頻數據處理方法,包括:
響應于音頻文件中發生丟幀事件,從該音頻文件中獲取多個音頻幀,該多個音頻幀為發生該丟幀事件的目標時刻之前的音頻幀;
獲取該多個音頻幀的幅度值序列和相位序列;
基于該幅度值序列,獲取該目標時刻的目標幅度值;
基于該多個音頻幀的相位序列,確定該目標時刻的目標相位;
基于該目標幅度值以及該目標相位,生成該目標時刻的目標音頻幀。
在一種可能實現方式中,該獲取該多個音頻幀的幅度值序列和相位序列包括:
對該多個音頻幀進行短時傅里葉變換,得到該多個音頻幀對應的幅度值序列和相位序列。
在一種可能實現方式中,該基于該幅度值序列,獲取該目標時刻的目標幅度值包括:
將該幅度值序列輸入音頻處理模型,由該音頻處理模型提取該幅度值序列的幅度特征;
通過該音頻處理模型基于該幅度特征,輸出該目標時刻的該目標幅度值。
在一種可能實現方式中,該基于該多個音頻幀的相位序列,確定該目標時刻的目標相位,包括:
基于該多個音頻幀的相位序列,獲取該多個音頻幀中相鄰兩個音頻幀之間的平均相位差;
將該多個音頻幀中最后一個音頻幀的相位與該平均相位差相加,得到該目標時刻的該目標相位。
在一種可能實現方式中,該基于該目標幅度值以及該目標相位,生成該目標時刻的目標音頻幀,包括:
將該目標幅度值與該目標相位相乘,得到該目標時刻對應的頻域數據;
對該頻域數據進行逆傅里葉變換,生成該目標音頻幀。
在一種可能實現方式中,該響應于音頻文件中發生丟幀事件,從該音頻文件中獲取多個音頻幀,包括:
在該音頻文件的接收過程中,檢測丟幀事件;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京達佳互聯信息技術有限公司,未經北京達佳互聯信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010718661.3/2.html,轉載請聲明來源鉆瓜專利網。





