[發明專利]網絡通話方法、裝置、計算機設備及存儲介質有效
| 申請號: | 201911259913.4 | 申請日: | 2019-12-10 |
| 公開(公告)號: | CN110992963B | 公開(公告)日: | 2023-09-29 |
| 發明(設計)人: | 梁俊斌 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G10L19/002 | 分類號: | G10L19/002;G10L19/24;H04L65/1069;H04L65/60 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 邢惠童 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網絡 通話 方法 裝置 計算機 設備 存儲 介質 | ||
本申請提供了一種網絡通話方法、裝置、計算機設備及存儲介質,屬于音頻數據處理領域。方法包括:對采集到的音頻信號進行時頻變換,得到音頻信號的多個頻域信息;根據所述多個頻域信息確定與所述音頻信號對應的目標碼率;基于目標碼率對音頻信號進行編碼,基于編碼后的音頻信號進行網絡通話。本申請不采用固定的編碼碼率對音頻信號進行處理,而是使用能夠達到特定語音質量的音頻信號訓練過后的碼率預測模型基于不同的音頻信號進行碼率預測,預測的碼率更加符合實際情況,基于預測的碼率對音頻信號進行碼率控制,可以提高網絡通話的質量。
技術領域
本申請涉及音頻數據處理領域,特別涉及一種網絡通話方法、裝置、計算機設備及存儲介質。
背景技術
隨著網絡技術的進步,越來越多的人會通過網絡進行通話,而網絡通話質量的高低一方面取決于當前網絡的連接質量,另一方面也取決于對音頻信號進行編碼的碼率高低。
由于網絡的連接質量一般是不可控的,相關技術中,往往在網絡通話啟動前就基于一些實驗經驗值對音頻編碼器設置相關的參數,使得音頻編碼器以固定碼率對音頻信號進行編碼,相關技術中的網絡通話過程參見圖1。
但是,以固定碼率對音頻信號進行編碼無法保證編碼后的音頻信號能夠以較好的質量呈現給接收方,網絡通話的效果不佳。
發明內容
本申請實施例提供了一種網絡通話方法、裝置、計算機設備及存儲介質,可以解決相關技術中網絡通話的效果不佳的問題。所述技術方案如下:
一方面,提供了一種網絡通話方法,所述方法包括:
對采集到的音頻信號進行時頻變換,得到所述音頻信號的多個頻域信息;
根據所述多個頻域信息確定與所述音頻信號對應的目標碼率;基于所述目標碼率對所述音頻信號進行編碼,基于編碼后的音頻信號進行網絡通話。
一方面,提供了一種網絡通話裝置,所述裝置包括:
變換模塊,用于對采集到的音頻信號進行時頻變換,得到所述音頻信號的多個頻域信息;
第一確定模塊,用于根據所述多個頻域信息確定與所述音頻信號對應的目標碼率;
編碼模塊,用于基于所述目標碼率對所述音頻信號進行編碼;
通話模塊,用于基于編碼后的音頻信號進行網絡通話。
在一種可能的實施方式中,所述訓練模塊包括:
第一變換單元,用于對所述多個樣本音頻信號進行時頻變換,得到多個樣本頻域信息;
輸入單元,用于將所述多個樣本頻域信息輸入到初始模型中;
預測單元,用于由所述初始模型基于所述多個樣本頻域信息進行碼率預測,輸出多個與所述多個樣本頻域信息對應的預測碼率;
第一調整單元,用于基于所述樣本碼率和所述預測碼率的差別信息,調整所述初始模型的模型參數,直至所述初始模型的模型參數符合目標截止條件時,停止訓練所述初始模型,將訓練后的初始模型作為所述碼率預測模型。
在一種可能的實施方式中,所述變換模塊包括:
第一劃分單元,用于將所述音頻信號劃分為多個音頻幀,其中,在時間上相鄰兩個音頻幀有重合部分;
加窗單元,用于對每個音頻幀進行加窗處理,得到多個加窗后的音頻幀;
第二變換單元,用于對所述多個加窗后的音頻幀進行傅里葉變換,得到所述多個頻域信息。
在一種可能的實施方式中,所述第二變換單元,包括:
變換子單元,用于對所述多個加窗后的音頻幀進行傅里葉變換,得到每個音頻幀的線性頻域參數;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911259913.4/2.html,轉載請聲明來源鉆瓜專利網。





