[發(fā)明專利]語音編碼裝置和語音編碼方法有效
| 申請?zhí)枺?/td> | 200680014576.7 | 申請日: | 2006-04-27 |
| 公開(公告)號: | CN101167126A | 公開(公告)日: | 2008-04-23 |
| 發(fā)明(設計)人: | 吉田幸司 | 申請(專利權(quán))人: | 松下電器產(chǎn)業(yè)株式會社 |
| 主分類號: | G10L19/00 | 分類號: | G10L19/00;G10L19/14 |
| 代理公司: | 北京市柳沈律師事務所 | 代理人: | 邸萬奎 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 編碼 裝置 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及語音編碼裝置和語音編碼方法,特別涉及用于立體聲語音的語音編碼裝置和語音編碼方法。
背景技術(shù)
隨著移動通信或IP通信中的傳輸頻帶的寬頻化、服務的多樣化,在語音通信中,對高質(zhì)量化、富于臨場感化的需求提高。例如,預計今后電視電話服務中的免提(hands?free)方式的通話、電視會議中的語音通信、多個通話者在多個地點同時進行會話的多地點語音通信、能夠在保持臨場感的同時傳輸周圍的聲音環(huán)境的語音通信等的需要增加。在該情況下,期望實現(xiàn)比單聲道信號富有臨場感,而且能夠識別多個通話者的講話位置的基于立體聲語音的語音通信。為了實現(xiàn)這樣的基于立體聲語音的語音通信,必須將立體聲語音編碼。
此外,在IP網(wǎng)絡上的語音數(shù)據(jù)通信中,為了實現(xiàn)網(wǎng)絡上的通信量控制和組播通信,期望具有可伸縮(scalable)的結(jié)構(gòu)的語音編碼方式。可伸縮的結(jié)構(gòu)是指在接收端即使從一部分的編碼數(shù)據(jù)也能夠進行語音數(shù)據(jù)的解碼的結(jié)構(gòu)。具有可伸縮的結(jié)構(gòu)的語音編碼方式中的編碼處理已被分層化,包含與核心層對應的處理和與增強層對應的處理。因此,通過該編碼處理所生成的編碼數(shù)據(jù)也包含核心層的編碼數(shù)據(jù)和增強層的編碼數(shù)據(jù)。
期望具有在將立體聲語音編碼并傳輸?shù)那闆r下也能夠在接收端選擇立體聲信號的解碼和使用了一部分的編碼數(shù)據(jù)的單聲道信號的解碼的、單聲道-立體聲之間的可伸縮結(jié)構(gòu)(單聲道/立體聲可伸縮結(jié)構(gòu))的語音編碼方式。
作為基于這樣的語音編碼方式的語音編碼方法,例如有通過聲道相互間的音調(diào)(pitch)預測來進行聲道(以下有時簡稱為“ch”)之間的信號預測(從第1ch信號預測第2ch信號或從第2ch信號預測第1ch信號),即利用兩個聲道之間的相關(guān)來進行編碼的方法(參照非專利文獻1)。
非專利文獻1:Ramprashad,S.A.,“tereophonic?CELP?coding?using?crosschannel?prediction”,Proc.IEEE?Workshop?on?Speech?Coding,pp.136-138,Sep.2000.
發(fā)明內(nèi)容
發(fā)明要解決的問題
但是,在上述現(xiàn)有的語音編碼方法中,在雙方的聲道之間的相關(guān)較小的情況下,有時不能獲得充分的預測性能(預測增益),編碼效率劣化。
本發(fā)明的目的在于,提供即使在雙方的聲道之間的相關(guān)較小的情況下也能夠高效率地對立體聲語音進行編碼的語音編碼裝置和語音編碼方法。
解決該問題的方案
本發(fā)明的語音編碼裝置對包含第1聲道信號和第2聲道信號的立體聲信號進行編碼,該語音編碼裝置采用的結(jié)構(gòu)包括:單聲道信號生成單元,使用所述第1聲道信號和所述第2聲道信號來生成單聲道信號;選擇單元,選擇所述第1聲道信號或所述第2聲道信號;以及編碼單元,將所生成的單聲道信號編碼而獲得核心層編碼數(shù)據(jù),同時將所選擇的聲道信號編碼而獲得與所述核心層編碼數(shù)據(jù)對應的增強層編碼數(shù)據(jù)。
本發(fā)明的語音編碼方法為對包含第1聲道信號和第2聲道信號的立體聲信號進行編碼,在該語音編碼方法中,使用所述第1聲道信號和所述第2聲道信號來生成單聲道信號;選擇所述第1聲道信號或所述第2聲道信號;以及將所生成的單聲道信號編碼而獲得核心層編碼數(shù)據(jù),同時將所選擇的聲道信號編碼而獲得與所述核心層編碼數(shù)據(jù)對應的增強層編碼數(shù)據(jù)。
發(fā)明的有益效果
根據(jù)本發(fā)明,即使在立體聲信號的多個聲道信號之間的相關(guān)小的情況下也能夠高效率地對立體聲語音進行編碼。
附圖說明
圖1是表示本發(fā)明實施方式1的語音編碼裝置的結(jié)構(gòu)的方框圖;
圖2是表示本發(fā)明實施方式1的語音解碼裝置的結(jié)構(gòu)的方框圖;
圖3是表示本發(fā)明實施方式2的語音編碼裝置的結(jié)構(gòu)的方框圖;
圖4是表示本發(fā)明實施方式3的語音編碼裝置的結(jié)構(gòu)的方框圖;
圖5是表示本發(fā)明實施方式3的編碼聲道選擇單元的結(jié)構(gòu)的方框圖;
圖6是表示本發(fā)明實施方式3的第Ach編碼單元的結(jié)構(gòu)的方框圖;
圖7是用于說明本發(fā)明實施方式3的第A聲道的聲道內(nèi)預測緩存器的一例更新動作的圖;
圖8是用于說明本發(fā)明實施方式3的第B聲道的聲道內(nèi)預測緩存器的一例更新動作的的圖;
圖9是表示本發(fā)明實施方式4的語音編碼裝置的結(jié)構(gòu)的方框圖;
圖10是表示本發(fā)明實施方式4的第AchCELP編碼單元的結(jié)構(gòu)的方框圖;
圖11是表示本發(fā)明實施方式4的一例自適應碼本更新動作的流程圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于松下電器產(chǎn)業(yè)株式會社,未經(jīng)松下電器產(chǎn)業(yè)株式會社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200680014576.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:具有飛行時間性能的PET/MR掃描儀
- 下一篇:化學處理方法及化學處理部件





