[發(fā)明專利]語音編碼有效

申請?zhí)枺?/td>	201080010209.6	申請日：	2010-01-05
公開（公告）號：	CN102341848A	公開（公告）日：	2012-02-01
發(fā)明（設(shè)計）人：	科恩·貝爾納德·福斯	申請（專利權(quán)）人：	斯凱普有限公司
主分類號：	G10L19/02	分類號：	G10L19/02
代理公司：	北京金信立方知識產(chǎn)權(quán)代理有限公司 11225	代理人：	黃威;徐愛萍
地址：	愛爾蘭***	國省代碼：	愛爾蘭;IE
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	語音編碼
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

技術(shù)領(lǐng)域

本發(fā)明涉及用于經(jīng)由傳輸介質(zhì)諸如借助于有線連接上的電子信號或者無線連接上的電磁信號進行傳輸?shù)恼Z音的編碼。

背景技術(shù)

在圖1a中示意性地示出了語音的聲源-濾波器模型。如所示，語音能夠被建模為包括從聲源102經(jīng)過時變?yōu)V波器104的信號。聲源信號表示聲帶的直接振動，而濾波器表示由咽喉、口部和舌頭的形狀形成的聲道的聲效。濾波器的作用是改變聲源信號的頻率分布從而增強或者削弱特定的頻率。語音編碼通過使用聲源-濾波器模型的參數(shù)表示語音來工作而不是試圖直接表示為實際的波形。

如圖1b中所示意性地示出的，編碼的信號將被分成多個幀106，其中每個幀包括多個子幀108。例如，語音可以16kHz被采樣并且以20ms的幀被處理，其中一些處理以5ms的子幀進行(每幀有4個子幀)。每個幀包括標(biāo)記107，幀通過標(biāo)記107根據(jù)其各自的類型被分類。因此每個幀至少被分為“濁音的”或者“清音的”，并且清音幀不同于濁音幀地被編碼。因此每個子幀108包括一組表示在該子幀中的語音聲音的聲源-濾波器模型的參數(shù)。

對于濁音聲音(諸如元音聲)，聲源信號具有對應(yīng)于感知到的聲音的基音的一定程度的長期周期性。在該情形中，聲源信號能夠被建模為包括準(zhǔn)周期性信號，其中每個周期包括一系列不同幅度的脈沖。源信號被稱為是“準(zhǔn)”周期性的，原因在于：在至少一個子幀的時標(biāo)上，可能需要使其具有大致恒定的單個的、有針對性的(meaningful)周期；但是在多個子幀或幀上，信號的周期和形狀則可改變。在任意給定點的大致周期可以被稱為基音滯后。在圖2a中示意性地示出了被建模的聲源信號202的示例，其中逐漸變化的周期P₁、P₂、P₃等各包括四個脈沖，脈沖可以從一個周期到下一個周期在形狀和幅度上逐漸變化。

根據(jù)諸如使用線性預(yù)測編碼(LPC)的算法的多種語音編碼算法，使用短期濾波器來將語音信號分成兩個單獨的分量：(i)表示時變?yōu)V波器104的作用的信號；和(ii)去除了濾波器104的作用的剩余信號，其表示聲源信號。表示濾波器104的作用的信號可以被稱為頻譜包絡(luò)線信號(spectral?envelope?signal)，并且典型地包括一系列描述在各個階段的頻譜包絡(luò)線的LPC參數(shù)組。圖2b示出了隨時間變化的一連串頻譜包絡(luò)線204₁、204₂、204₃等的示意性示例。如圖2a示意性所示，當(dāng)去除了變化的頻譜包絡(luò)線時，僅表示聲源的剩余信號可以被稱為LPC殘差信號。

頻譜包絡(luò)線信號和聲源信號各自被單獨編碼以進行傳輸。在圖示出的示例中，各個子幀106將包含：(i)表示頻譜包絡(luò)線204的一組參數(shù)；和(ii)表示聲源信號202的脈沖的一組參數(shù)。

在圖示出的示例中，各個子幀106將包含：(i)一組量化的表示頻譜包絡(luò)線的LPC參數(shù)；(ii)(a)與聲源信號中的基音周期之間的相關(guān)性有關(guān)的量化的LTP矢量，和(ii)(b)表示去除了周期間相關(guān)性和頻譜包絡(luò)線的作用的聲源信號的量化的LTP殘差信號。

殘差信號包括在原始輸入的語音信號中存在的信息，該信息未被量化的LPC參數(shù)和LTP矢量所表示。此信息必須與LPC參數(shù)和LTP參數(shù)一起進行編碼和發(fā)送以便允許編碼的語音信號在解碼器中被準(zhǔn)確地合成。為了降低傳輸編碼的語音信號所需的比特率，優(yōu)選的是使殘差信號的能量最小化，因此使對殘差信號進行編碼所需的比特率最小化。

本發(fā)明的一些實施例的目的在于解決或者至少緩解一些現(xiàn)有技術(shù)中的上述問題。

發(fā)明內(nèi)容

根據(jù)本發(fā)明的一個方案，提供了一種根據(jù)聲源-濾波器模型對語音信號進行編碼從而將語音建模為包括由時變?yōu)V波器濾波的聲源信號的方法，所述方法包括：接收包括連續(xù)幀的語音信號；對于所述語音信號的多個幀中的每個：使預(yù)定的噪聲信號與輸入的語音信號相加以生成模擬信號；基于模擬信號幀來確定線性預(yù)測編碼系數(shù)；以及基于語音輸入信號和所述線性預(yù)測編碼系數(shù)來確定線性預(yù)測編碼殘差信號；以及基于所述線性預(yù)測編碼系數(shù)和所述線性預(yù)測編碼殘差信號，形成表示所述語音信號的編碼信號。

在實施例中，所述方法可進一步包括基于所述線性預(yù)測編碼殘差信號來生成量化的殘差信號。

生成量化的殘差信號可以進一步生成相關(guān)的量化噪聲信號，并且所述預(yù)定的噪聲信號包括白噪聲，所述白噪聲具有的方差(variance)可等于量化噪聲的方差。

可通過使白噪聲信號與量化增益值相結(jié)合來生成所述預(yù)定的噪聲信號?？梢栽谠肼暢尚畏治鲋猩伤隽炕鲆嬷?。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于斯凱普有限公司，未經(jīng)斯凱普有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201080010209.6/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用頻譜分析，例如變換聲碼器或子頻帶聲碼器
G10L19-04 .利用預(yù)測技術(shù)
G10L19-06 ..例如短期預(yù)測系數(shù)的頻譜特征的確定或編碼
G10L19-08 ..激勵函數(shù)的確定或編碼；長期預(yù)測參數(shù)的確定或編碼
G10L19-14 ..不包括在G10L 19/06至G10L 19/12組中的零部件，例如增益編碼、后置濾波設(shè)計或聲碼器結(jié)構(gòu)

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】