[發明專利]立體聲相位參數的編碼方法及裝置有效
| 申請號: | 201310632664.5 | 申請日: | 2013-11-29 |
| 公開(公告)號: | CN104681029B | 公開(公告)日: | 2018-06-05 |
| 發明(設計)人: | 張興濤;苗磊;吳文海 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G10L19/008 | 分類號: | G10L19/008 |
| 代理公司: | 北京中博世達專利商標代理有限公司 11274 | 代理人: | 申健 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 立體聲 相位參數 全局 相位信息 信息技術領域 立體聲音頻 恢復 | ||
本發明實施例公開了一種立體聲相位參數的編碼方法及裝置,涉及信息技術領域,可以提高立體聲音頻相位信息的效果。所述方法包括:首先獲取當前幀的立體聲全局相位參數,然后確定當前幀的立體聲全局相位參數的值,并根據當前幀的立體聲全局相位參數的值的確定結果,對當前幀的立體聲全局相位參數的值進行調整,最后對調整后的當前幀的立體聲全局相位參數的值進行編碼。本發明實施例適用于恢復立體聲相位信息。
技術領域
本發明涉及信息技術領域,特別涉及一種立體聲相位參數的編碼方法及裝置。
背景技術
隨著人們物質生活水平的不斷提高,人們對音頻效果的要求越來越高。與單聲道音頻相比,立體聲音頻具有各聲源的方位感和分布感,能夠提高音頻信息的清晰度,因此立體聲音頻可以更好地滿足人們對音頻效果的需求。
目前,獲取立體聲音頻信號時,通過提取Global(全局)參數,根據Global參數恢復立體聲相位信息。其中,Global參數包括G_ITD(Global Inter-Channel Time Difference,群時延)及G_IPD(Global Inter-Channel Phase Difference,群相位)。
然而,通過提取Global參數直接恢復立體聲相位信息,提取的G_ITD及G_IPD準確度較低,無法根據G_ITD及G_IPD恢復原始立體聲相位信息,從而導致立體聲音頻信息的效果較差。
發明內容
本發明實施例提供一種立體聲相位參數的編碼方法及裝置,可以提高立體聲音頻信息的效果。
本發明實施例采用的技術方案為:
第一方面,本發明提實施例供一種立體聲相位參數的編碼方法,包括:
獲取當前幀的立體聲全局相位參數;
確定所述當前幀的立體聲全局相位參數的值;
根據所述當前幀的立體聲全局相位參數的值的確定結果,對所述當前幀的立體聲全局相位參數的值進行調整;
對調整后的當前幀的立體聲全局相位參數的值進行編碼。
在第一方面的第一種實現方式中,所述根據所述當前幀的立體聲全局相位參數的值的確定結果,對所述當前幀的立體聲全局相位參數的值進行調整具體包括:
獲取所述當前幀的各個子帶的聲道間時間差;
根據所述當前幀的各個子帶的聲道間時間差,計算所述當前幀的各個子帶的聲道間時間差的絕對值均值;
根據所述當前幀的立體聲全局相位參數的值的確定結果以及所述當前幀的各個子帶的聲道間時間差的絕對值均值,對所述當前幀的立體聲全局相位參數的值進行調整。
結合第一方面或者第一方面的第一種實現方式,在第一方面的第二種實現方式中,在所述當前幀不是數據流的第一個數據幀時,所述根據所述當前幀的立體聲全局相位參數的值的確定結果以及所述當前幀的各個子帶的聲道間時間差的絕對值均值,對所述當前幀的立體聲全局相位參數的值進行調整前進一步包括:
對所述當前幀的各個子帶的聲道間時間差的絕對值均值進行幀間平滑處理,獲取所述當前幀的各個子帶的平滑處理后的聲道間時間差的絕對值均值;
所述根據所述當前幀的立體聲全局相位參數的值的確定結果以及所述當前幀的各個子帶的聲道間時間差的絕對值均值,對所述當前幀的立體聲全局相位參數的值進行調整具體包括:
根據所述當前幀的立體聲全局相位參數的值的確定結果以及所述當前幀的各個子帶的平滑處理后的聲道間時間差的絕對值均值,對所述當前幀的立體聲全局相位參數的值進行調整。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310632664.5/2.html,轉載請聲明來源鉆瓜專利網。





