[發(fā)明專利]用于提升語音丟幀補償性能的混合多描述正弦編碼器方法有效
| 申請?zhí)枺?/td> | 201811342149.2 | 申請日: | 2018-11-13 |
| 公開(公告)號: | CN109616129B | 公開(公告)日: | 2021-07-30 |
| 發(fā)明(設計)人: | 林志斌;劉曉峻;狄敏 | 申請(專利權)人: | 南京南大電子智慧型服務機器人研究院有限公司;南京大學;江蘇南大電子信息技術股份有限公司;馬鞍山艾德聲電子技術有限公司 |
| 主分類號: | G10L19/005 | 分類號: | G10L19/005;G10L19/07;G10L19/26 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 彭雄 |
| 地址: | 210019 江蘇省南京市建*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 提升 語音 補償 性能 混合 描述 正弦 編碼器 方法 | ||
1.一種用于提升語音丟幀補償性能的混合多描述正弦編碼器方法,其特征在于:編碼器框架結構包括三個編碼器,分別為多描述正弦編碼器、參數編碼器一和參數編碼器二,其中多描述正弦編碼器是核心編解碼器,參數編碼器一和參數編碼器二為發(fā)送端丟包補償用輔助編碼器,引入兩幀的信號延遲,增加了混合多描述正弦編碼器的編解碼器對網絡丟包的魯棒性;其中多描述正弦編碼器為基于多描述框架的正弦編碼器,
多描述正弦編碼器主要由兩部分組成,其中一部分為線譜對參數冗余描述,另一部分為殘差信號的匹配跟蹤正弦建模模塊及其交織多描述;采用線性預測求殘差的方式進行混合多描述編碼,其中線譜對參數量化采用感知加權分裂矢量量化方式進行,采用10階全極點濾波器進行線性預測,轉化成10個對應的LSF參數,采用分裂矢量量化方式將10維的矢量分裂成3個矢量,然后分別對這3個矢量進行矢量量化的分裂矢量量化;首先將10維LSP參數分別分組為LSF1={lsf(1),lsf(2),lsf(3)},LSF2={lsf(4),lsf(5),lsf(6)},和LSF3={lsf(7),lsf(8),lsf(9),lsf(10)};同時對LSF1碼本以lsf(3)為基準進行由小到大排序,對LSF3碼本以lsf(7)為基準進行由小到大排序;LSF1、LSF2和LSF3三個碼本的大小分別為M1、M2和M3;先量化矢量LSF2,在量化LSF1之前,先找到LSF1碼本中l(wèi)sf(3)lsf(4)的碼本序號Index1,僅在碼本的序號1~Index1間搜索與LSF1最鄰近的碼字;在量化LSF3之前,先找到LSF3碼本中l(wèi)sf(7)lsf(6)的碼本序號Index3,僅在碼本的序號Index1~M3場間搜索與LSF3最鄰近的碼字;對分裂量化得到的矢量進行冗余描述,復制一份描述到描述2,與匹配跟蹤中的正弦描述傳輸分組至編碼器描述2碼流;
在正弦模型中,每一幀語音信號用一組正弦信號之和來表示,因此,對于第i幀信號有
采用正弦字典對語音信號進行信號分解,在一個高度冗余的字典空間D中將輸入信號s(n)分解成一組原子信號的線性組合,假定包含M個原子的字典為:
D={gm};m=0,1,...,M-1 (3)
匹配跟蹤的分解迭代過程如下:
設置初始輸入信號為當前殘差信號,即令r0=s(n),在第k步迭代中,k=0,查找第k個原子索引mk,使該原子與當前殘差信號rk的相關系數最大,此時對應的原子字典的頻率就是建模頻率,而此刻該正弦原子的幅度就是殘差信號和原子的內積:
此時得到重構信號為:
其中K為迭代次數;
對于正弦建模來說,采用如下的復指數原子組成的正弦字典:
此處字典空間是由復指數原子所刻畫的,采用共軛子空間投影技術,在由字典原子及其復共軛所形成的子空間中計算相關系數,其結果也以共軛對的形式出現,這樣第k步迭代得到的殘差信號為:
此時合成信號為:
此為正弦合成的基本原理公式,ξk亦為復數;
由匹配跟蹤得到對應的一組幅度、頻率和相位k<=K,其中K為提取的正弦數目,若K為偶數,將該組正弦建模參數按照幅度進行能量大小排列,對新排序的參數分組,其中分組一為所對應的一組幅度頻率和相位,分組二:所對應的一組幅度頻率和相位,在兩個分組之間加入一定冗余,將分組一中的前兩個以上的能量大的信號加入分組二,分組二中的前兩個以上的能量大的信號加入分組一,保持兩個分組描述能量的一致性,分組后的正弦多描述為:
2.根據權利要求1所述用于提升語音丟幀補償性能的混合多描述正弦編碼器方法,其特征在于:參數編碼器一和參數編碼器二為正弦參數編碼器,或者參數編碼器一和參數編碼器二為低比特率的參數編碼器。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京南大電子智慧型服務機器人研究院有限公司;南京大學;江蘇南大電子信息技術股份有限公司;馬鞍山艾德聲電子技術有限公司,未經南京南大電子智慧型服務機器人研究院有限公司;南京大學;江蘇南大電子信息技術股份有限公司;馬鞍山艾德聲電子技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811342149.2/1.html,轉載請聲明來源鉆瓜專利網。





