[發明專利]音頻數據處理方法、裝置、計算機設備及存儲介質在審

申請號：	202010718661.3	申請日：	2020-07-23
公開（公告）號：	CN111883147A	公開（公告）日：	2020-11-03
發明（設計）人：	張旭;鄭羲光;張晨	申請（專利權）人：	北京達佳互聯信息技術有限公司
主分類號：	G10L19/005	分類號：	G10L19/005;G10L19/02
代理公司：	北京三高永信知識產權代理有限責任公司 11138	代理人：	寧立存
地址：	100085 北京市海淀***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	音頻數據處理方法裝置計算機設備存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種音頻數據處理方法，其特征在于，包括：

響應于音頻文件中發生丟幀事件，從所述音頻文件中獲取多個音頻幀，所述多個音頻幀為發生所述丟幀事件的目標時刻之前的音頻幀；

獲取所述多個音頻幀的幅度值序列和相位序列；

基于所述幅度值序列，獲取所述目標時刻的目標幅度值；

基于所述多個音頻幀的相位序列，確定所述目標時刻的目標相位；

基于所述目標幅度值以及所述目標相位，生成所述目標時刻的目標音頻幀。

2.根據權利要求1所述的音頻數據處理方法，其特征在于，所述獲取所述多個音頻幀的幅度值序列和相位序列包括：

對所述多個音頻幀進行短時傅里葉變換，得到所述多個音頻幀對應的幅度值序列和相位序列。

3.根據權利要求1所述的音頻數據處理方法，其特征在于，所述基于所述幅度值序列，獲取所述目標時刻的目標幅度值包括：

將所述幅度值序列輸入音頻處理模型，由所述音頻處理模型提取所述幅度值序列的幅度特征；

通過所述音頻處理模型基于所述幅度特征，輸出所述目標時刻的所述目標幅度值。

4.根據權利要求1所述的音頻數據處理方法，其特征在于，所述基于所述多個音頻幀的相位序列，確定所述目標時刻的目標相位，包括：

基于所述多個音頻幀的相位序列，獲取所述多個音頻幀中相鄰兩個音頻幀之間的平均相位差；

將所述多個音頻幀中最后一個音頻幀的相位與所述平均相位差相加，得到所述目標時刻的所述目標相位。

5.根據權利要求1所述的音頻數據處理方法，其特征在于，所述基于所述目標幅度值以及所述目標相位，生成所述目標時刻的目標音頻幀，包括：

將所述目標幅度值與所述目標相位相乘，得到所述目標時刻對應的頻域數據；對所述頻域數據進行逆傅里葉變換，生成所述目標音頻幀。

6.根據權利要求1所述的音頻數據處理方法，其特征在于，所述響應于音頻文件中發生丟幀事件，從所述音頻文件中獲取多個音頻幀，包括：

在所述音頻文件的接收過程中，檢測丟幀事件；

響應于在目標時刻檢測到發生丟幀事件，從所述音頻文件中，獲取在所述目標時刻之前接收到的所述多個音頻幀。

7.根據權利要求1所述的音頻數據處理方法，其特征在于，所述多個音頻幀的數目基于所述音頻文件中發生連續丟幀事件的持續時長確定。

8.一種音頻數據處理裝置，其特征在于，包括：

第一獲取單元，被配置為響應于音頻文件中發生丟幀事件，從所述音頻文件中獲取多個音頻幀，所述多個音頻幀為發生所述丟幀事件的目標時刻之前的音頻幀；

第二獲取單元，被配置為獲取所述多個音頻幀的幅度值序列和相位序列；

第三獲取單元，被配置為基于所述幅度值序列，獲取所述目標時刻的目標幅度值；

確定單元，被配置為基于所述多個音頻幀的相位序列，確定所述目標時刻的目標相位；

生成單元，被配置為基于所述目標幅度值以及所述目標相位，生成所述目標時刻的目標音頻幀。

9.一種計算機設備，其特征在于，包括：

處理器；

用于存儲所述處理器可執行指令的存儲器；

其中，所述處理器被配置為執行所述指令，以實現如權利要求1至7中任一項所述的音頻數據處理方法。

10.一種計算機可讀存儲介質，當所述計算機可讀存儲介質中的指令由計算機設備的處理器執行時，使得所述計算機設備能夠執行如權利要求1至7中任一項所述的音頻數據處理方法。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京達佳互聯信息技術有限公司，未經北京達佳互聯信息技術有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010718661.3/1.html，轉載請聲明來源鉆瓜專利網。

上一篇：一種地鐵列車空調溫度調節系統及其方法
下一篇：確定電子器件的方法、裝置、介質及設備

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用頻譜分析，例如變換聲碼器或子頻帶聲碼器
G10L19-04 .利用預測技術
G10L19-06 ..例如短期預測系數的頻譜特征的確定或編碼
G10L19-08 ..激勵函數的確定或編碼；長期預測參數的確定或編碼
G10L19-14 ..不包括在G10L 19/06至G10L 19/12組中的零部件，例如增益編碼、后置濾波設計或聲碼器結構

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】