[發明專利]一種基于G.722.1的多描述語音編碼方法有效
| 申請號: | 202010177908.5 | 申請日: | 2020-03-13 |
| 公開(公告)號: | CN111402907B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 陳喆;殷福亮;何瑩男 | 申請(專利權)人: | 大連理工大學 |
| 主分類號: | G10L19/16 | 分類號: | G10L19/16;G10L19/032 |
| 代理公司: | 大連東方專利代理有限責任公司 21212 | 代理人: | 姜玉蓉;李洪福 |
| 地址: | 116024 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 722.1 描述 語音 編碼 方法 | ||
1.一種基于G.722.1的多描述語音編碼方法,其特征在于包括:
將原始語音信號分別輸入至G.722.1編碼器和互補編碼器進行編碼分別得到碼流I和碼流II;
將原始語音信號輸入至G.722.1編碼器進行MLT變換得到MLT系數,將MLT系數劃分為多個區域并計算每個區域的區域功率,對區域功率進行量化處理得到區域功率的量化指數,對量化指數進行編碼得到區域功率編碼比特,對MLT系數、區域功率的量化指數以及區域功率編碼比特進行進一步編碼處理得到碼流I;
將原始語音信號輸入至互補編碼器中首先獲取語音信號的量化指數,對該量化指數進行優化調整獲得該語音信號的碼流,對該碼流進行部分解碼處理得到對應的解碼MLT系數,將此解碼MLT系數和碼流I進行部分解碼得到的MLT系數輸入至感知誤差計算模塊獲取感知誤差,循環優化調整過程在最優調整方案下獲取碼流II;
將碼流I和碼流II分別打包成packet1和packet2,再將packet1和packet2通過通信網絡傳輸至解碼器中進行解碼得到解碼語音信號。
2.根據權利要求1所述的一種基于G.722.1的多描述語音編碼方法,其特征還在于:所述量化指數進行優化調整過程為:
設量化指數為rms_index(r),集合C={rms_index(r)-1,rms_index(r)+1},將編碼器分為14個區域,每一區域有兩種可能取值,將每個區域r初步量化的rms_index(r)替換為集合C中的任一元素,對全部14個區域進行調整,共有約為214-1種調整方法,對于任一區域r,有-8≤rms_index(r)≤31,r≠0,因此對于rms_index(r)=-8,對于區域0,rms_index(0)=0,不選取集合C的第一個元素,對于rms_index(r)=31,不選取集合C的第二個元素,設初始調整方法為P0,P0為214-1種調整方法中的隨機一種,最優調整方法為Pm,并滿足聯合感知誤差最小同時互補編碼器的感知誤差不大于G.722.1編碼器的感知誤差。
3.根據權利要求2所述的一種基于G.722.1的多描述語音編碼方法,其特征還在于:所述感知誤差采用如下方式獲取:
將碼流I進行部分解碼得到enc1_mlt(n),將優化調整后的碼流進行部分解碼得到enc2_mlt(n),對enc1_mlt(n)和enc2_mlt(n)加權得到聯合解碼的MLT系數com_mlt(n),其計算公式為
計算相對誤差
計算感知加權權重w(n)
其中E是等響度曲線中聽閾曲線上對應25nHz頻率的dB值;
計算感知誤差為
其中0≤n280,mlt(n)為編碼信號經過MLT變換得到的MLT系數,將式(4)中的com_mlt(n)替換為enc1_mlt(n)和enc2_mlt(n),對應的誤差記為eenc1和eenc2。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連理工大學,未經大連理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010177908.5/1.html,轉載請聲明來源鉆瓜專利網。





