[發明專利]語音編碼裝置和語音編碼方法有效
| 申請號: | 200680009695.3 | 申請日: | 2006-03-23 |
| 公開(公告)號: | CN101147191A | 公開(公告)日: | 2008-03-19 |
| 發明(設計)人: | 吉田幸司 | 申請(專利權)人: | 松下電器產業株式會社 |
| 主分類號: | G10L19/00 | 分類號: | G10L19/00;G10L19/14 |
| 代理公司: | 北京市柳沈律師事務所 | 代理人: | 邸萬奎 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 編碼 裝置 方法 | ||
技術領域
本發明涉及語音編碼裝置和語音編碼方法,特別涉及用于立體聲語音的語音編碼裝置和語音編碼方法。
背景技術
隨著移動通信和IP通信中的傳輸頻帶的寬帶化以及服務的多樣化,在語音通信中,對高音質化和高臨場感的需求日益增強。
例如,今后可以預料以下的需求增多,即,在電視電話服務中的免提形式的通話、在視訊會議中的語音通信、如在多個地點由多個說話者同時進行通話的多地點語音通信、如在保持臨場感的同時,能夠傳輸周圍的聲音環境的語音通信等的需求。此時,期望實現例如比單聲道信號更有臨場感且能夠認識多個說話者的說話位置的、使用立體聲語音的語音通信。為了實現這樣的使用立體聲語音的語音通信,必須進行立體聲語音的編碼。
另外,在lP網絡上的語音數據通信中,為了實現網絡上的業務控制和組播通信,期望具有可擴展結構的語音編碼。所謂可擴展結構是指,在接收端,即使從編碼數據的一部分也能夠進行語音數據的解碼的結構。
在立體聲語音的編碼中,也期望能夠在接收端對立體聲信號的解碼或使用編碼數據的一部分的單聲道信號的解碼進行選擇的編碼,即,具有單聲道/立體聲之間的可擴展結構(單聲道/立體聲可擴展結構)的編碼。
具有單聲道/立體聲可擴展結構的語音編碼方法之一,有基于聲道相互間的基音(pitch)預測而對聲道(以下,適當地略稱“ch”)間的信號進行預測(基于第一ch信號預測第二ch信號,或者基于第二ch信號預測第一ch信號)的編碼方法,即,利用兩個聲道間的相關的編碼方法(參照非專利文獻1)。
[非專利文獻1]Ramprashad,S.A.,“Stereophonic?CELP?coding?using?crosschannel?prediction”,Proc.IEEE?Workshop?on?Speech?Coding,pp.136-138,Sep.2000.
發明內容
發明需要解決的問題
然而,在上述的非專利文獻1記載的語音編碼方法中,聲道間的預測參數(聲道間的基音預測的延遲和增益),各自被單獨地進行編碼,所以編碼效率不高。
本發明的目的為提供能夠對立體聲語音高效率地進行編碼的語音編碼裝置和語音編碼方法。
解決該問題的方案
本發明的語音編碼裝置所采用的結構包括:預測參數分析單元,求第一信號和第二信號之間的延遲差與振幅比作為預測參數;以及量化單元,基于所述延遲差和所述振幅比之間的相關性,使用所述預測參數獲得量化預測參數。
發明的有益效果
根據本發明,能夠對立體聲語音高效率地進行編碼。
附圖說明
圖1是表示實施方式1的語音編碼裝置的結構的方框圖。
圖2是表示實施方式1的第二ch預測單元的結構的方框圖。
圖3是表示實施方式1的預測參數量化單元的結構的方框圖(結構例1)。
圖4是表示實施方式1的預測參數代碼本的一個例子的特性圖。
圖5是表示實施方式1的預測參數量化單元的結構的方框圖(結構例2)。
圖6是表示實施方式1的振幅比估計單元中所使用的函數的一個例子的特性圖。
圖7是表示實施方式2的預測參數量化單元的結構的方框圖(結構例3)。
圖8是表示實施方式2的失真計算單元中所使用的函數的一個例子的特性圖。
圖9是表示實施方式2的預測參數量化單元的結構的方框圖(結構例4)。
圖10是表示實施方式2的振幅比校正單元和振幅比估計單元中所使用的函數的一個例子的特性圖。
圖11是表示實施方式2的預測參數量化單元的結構的方框圖(結構例5)。
具體實施方式
以下,參照附圖詳細說明本發明的實施方式。
(實施方式1)
圖1表示本實施方式的語音編碼裝置的結構。
圖1所示的語音編碼裝置10包括第一ch編碼單元11、第一ch解碼單元12、第二ch預測單元13、減法器14以及第二ch預測殘差編碼單元15。
另外,在以下的說明中,以幀單位的動作為前提來進行說明。
第一ch編碼單元11對從輸入立體聲信號中的第一ch語音信號s_ch1(n)(n=0~NF-l;NF是幀長度)進行編碼,并將第一ch語音信號的編碼數據(第一ch編碼數據)輸出到第一ch解碼單元12。另外,將該第一ch編碼數據與第二ch預測參數編碼數據和第二ch編碼數據復用而傳輸到語音解碼裝置(未圖示)。
第一ch解碼單元12由第一ch編碼數據生成第一ch解碼信號,并將它輸出到第二ch預測單元13。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于松下電器產業株式會社,未經松下電器產業株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200680009695.3/2.html,轉載請聲明來源鉆瓜專利網。





