[發明專利]語音編碼有效
| 申請號: | 201080010208.1 | 申請日: | 2010-01-05 |
| 公開(公告)號: | CN102341850A | 公開(公告)日: | 2012-02-01 |
| 發明(設計)人: | 科恩·貝爾納德·福斯 | 申請(專利權)人: | 斯凱普有限公司 |
| 主分類號: | G10L19/08 | 分類號: | G10L19/08;G10L19/04 |
| 代理公司: | 北京金信立方知識產權代理有限公司 11225 | 代理人: | 黃威;徐愛萍 |
| 地址: | 愛爾蘭*** | 國省代碼: | 愛爾蘭;IE |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 編碼 | ||
技術領域
本發明涉及用于經由傳輸介質諸如借助于有線連接上的電子信號或者無線連接上的電磁信號進行傳輸的語音的編碼。
背景技術
在圖1a中示意性地示出了語音的聲源-濾波器模型。如所示,語音能夠被建模為包括從聲源102經過時變濾波器104的信號。聲源信號表示聲帶的直接振動,而濾波器表示由咽喉、口部和舌頭的形狀形成的聲道的聲效。濾波器的作用是改變聲源信號的頻率分布從而增強或者削弱特定的頻率。語音編碼通過使用聲源-濾波器模型的參數表示語音來工作而不是試圖直接表示為實際的波形。
如圖1b中所示意性地示出的,編碼信號將被分成多個幀106,其中每個幀包括多個子幀108。例如,語音可以16kHz被采樣并且以20ms的幀被處理,其中一些處理以5ms的子幀進行(每幀有4個子幀)。每個幀包括標記107,幀通過標記107根據其各自的類型被分類。因此每個幀至少被分為“濁音的”或者“清音的”,并且清音幀不同于濁音幀地被編碼。因此每個子幀108包括一組表示在該子幀中的語音聲音的聲源-濾波器模型的參數。
對于濁音聲音(諸如元音聲),聲源信號具有對應于感知到的聲音的基音的一定程度的長期周期性。在該情形中,聲源信號能夠被建模為包括準周期性信號,其中對應于各自的“基音脈沖”的每個周期包括一系列不同幅度的波峰。聲源信號被稱為是“準”周期性的,原因在于:在至少一個子幀的時標上,可能需要使其具有大致恒定的單個的、有針對性的(meaningful)周期;但是在多個子幀或幀上,信號的周期和形狀則可改變。在任意給定點的大致周期可以被稱為基音滯后?;魷竽軌虮患皶r測定或者根據多個樣本測定。在圖2a中示意性地示出了被建模的聲源信號202的示例,其中逐漸變化的周期P1、P2、P3等各包括四個波峰的基音脈沖,基音脈沖可以從一個周期到下一個周期在形狀和幅度上逐漸變化。
根據諸如使用線性預測編碼(LPC)的算法的多種語音編碼算法,使用短期濾波器來將語音信號分成兩個單獨的分量:(i)表示時變濾波器104的作用的信號;和(ii)去除了濾波器104的作用的剩余信號,其表示聲源信號。表示濾波器104的作用的信號可以被稱為頻譜包絡線信號(spectral?envelope?signal),并且典型地包括一系列描述在各個階段的頻譜包絡線的LPC參數組。圖2b示出了隨時間變化的一連串頻譜包絡線2041、2042、2043等的示意性示例。如圖2a示意性所示,當去除了變化的頻譜包絡線時,僅表示聲源的剩余信號可以被稱為LPC殘差信號。短期濾波器通過去除短期相關性(即與基音周期相比的短期)而工作,從而產生具有比語音信號更少能量的LPC殘差。
頻譜包絡線信號和聲源信號各自被單獨編碼以進行傳輸。在圖示出的示例中,各個子幀106將包含:(i)表示頻譜包絡線204的一組參數;和(ii)表示去除了短期相關性的作用的聲源信號202的LPC殘差信號。
為了改善聲源信號的編碼,可以利用其周期性。為此,使用長期預測(LTP)分析來確定LPC殘差信號從一個周期到下一個周期與其自身的相關性,即在當前基音滯后下當前時間的LPC殘差信號與一個周期之后的LPC殘差信號之間的相關性(相關性是數據組之間的相關程度的統計測定結果,在該情形中是信號的部分之間的重復度)。就此而言,聲源信號可被稱為是“準”周期性的,原因在于:在至少一次相關性計算的時標上,可能需要使其具有大致(但非精確地)恒定的有針對性的周期;但是在多次的這種計算上,聲源信號的周期和形狀則可改變得更加明顯。對于每個子幀,從此相關性導出(derive)的一組參數被確定為至少部分地表示聲源信號。每個子幀的參數組典型地是一組系列系數,該組系列系數形成各自的矢量。
然后從LPC殘差中去除這個周期間相關性的作用,留下去除了基音周期之間的相關性的作用的表示聲源信號的LTP殘差信號。為了表示聲源信號,LTP矢量和LTP殘差信號被單獨地編碼以進行傳輸。在編碼器中,LTP分析濾波器使用一個或者多個基音滯后和LTP系數以通過LPC殘差計算LPC殘差信號。
基音滯后、LTP矢量和LTP殘差信號與經編碼的LTP殘差一起被發送給解碼器,并且用來構成語音輸出信號。它們在傳輸之前各自被量化(量化是將連續范圍的值轉換為一組離散值,或者將較大的大致連續的一組離散值轉換為較小的一組離散值的處理)。將LPC殘差信號分成LTP矢量和LTP殘差信號的優點在于,LTP殘差典型地具有比LPC殘差小的能量,因此需要較少的比特來進行量化。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于斯凱普有限公司,未經斯凱普有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201080010208.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:智能型高速漿紗機
- 下一篇:粘附碳黑鋼砂的清洗防銹劑及制備方法





