[發明專利]語音編碼裝置和語音編碼方法有效

申請號：	200580045069.5	申請日：	2005-12-26
公開（公告）號：	CN101091208A	公開（公告）日：	2007-12-19
發明（設計）人：	吉田幸司;后藤道代	申請（專利權）人：	松下電器產業株式會社
主分類號：	G10L19/14	分類號：	G10L19/14
代理公司：	北京市柳沈律師事務所	代理人：	黃小臨
地址：	日本***	國省代碼：	日本;JP
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語音編碼裝置方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及語音編碼裝置和語音編碼方法，特別涉及用于立體聲語音的語音編碼裝置和語音編碼方法。

背景技術

隨著移動通信或IP通信中的傳輸頻帶的寬頻化、服務的多樣化，在語音通信中，對高質量化、高臨場感化的需求提高。例如，預計今后電視電話服務中的免提(hands?free)方式的通話、電視會議中的語音通信、多個通話者在多個地點同時進行會話的多地點語音通信、以及能夠在保持臨場感的同時傳輸周圍的聲音環境的語音通信等的需要會增加。在該情況下，期望實現比單聲道信號有臨場感，而且能夠識別多個通話者的講話位置的基于立體聲語音的語音通信。為了實現這樣的基于立體聲語音的語音通信，必須將立體聲語音編碼。

此外，在IP網絡上的語音數據通信中，為了實現網絡上的通信量控制和組播通信，期望具有可伸縮(scalable)的結構的語音編碼。可伸縮的結構是指在接收端即使由部分的編碼數據也能夠進行語音數據的解碼的結構。

從而，期望具有在將立體聲語音編碼并傳輸的情況下也能夠在接收端選擇立體聲信號的解碼和使用了編碼數據的一部分的單聲道信號的解碼的、單聲道-立體聲之間的可伸縮結構(單聲道/立體聲可伸縮結構)的編碼。

作為這樣的具有單聲道/立體聲可伸縮結構的語音編碼方法，例如有通過聲道相互間的音調(pitch)預測來進行聲道(以下酌情簡稱為“ch”)之間的信號預測(從第一ch信號預測第二ch信號或從第二ch信號預測第一ch信號)，即利用兩個聲道之間的相關來進行編碼的方法(參照非專利文獻1)。

非專利文獻1：Ramprashad，S.A.，“Stereophonic?CELP?coding?using?crosschannel?prediction”，Proc.IEEE?Workshop?on?Speech?Coding，pp.136-138，Sep.2000.

發明內容

但是，在上述非專利文獻1記載的語音編碼方法中，在兩個聲道之間的相關小的情況下，聲道之間的預測的性能(預測增益(gain))降低，編碼效率惡化。

本發明的目的在于提供一種在具有單聲道/立體聲可伸縮結構的語音編碼中，即使在立體聲信號的多個聲道信號之間的相關小的情況下也能夠高效率地將立體聲語音編碼的語音編碼裝置和語音編碼方法。

本發明的語音編碼裝置，包括：第一編碼部件，在核心層中進行單聲道信號的編碼；以及第二編碼部件，在增強層中進行立體聲信號的編碼，所述第一編碼部件具有生成部件，用于將包含第一聲道信號和第二聲道信號的立體聲信號作為輸入信號，由所述第一聲道信號以及所述第二聲道信號生成單聲道信號，所述第二編碼部件具有：合成部件，用于根據從所述單聲道信號得到的信號，對所述第一聲道信號或所述第二聲道信號的預測信號進行合成；以及計算部件，用于由所述第一聲道信號或所述第二聲道信號計算第一聲道線性預測編碼殘差信號或第二聲道線性預測編碼殘差信號，其中，所述合成部件使用所述第一聲道線性預測編碼殘差信號或所述第二聲道線性預測編碼殘差信號相對于將所述單聲道信號進行碼激勵線性預測(CELP：Code?Excited?Linear?Prediction)編碼而得到的單聲道驅動音源信號的延遲差和振幅比，合成所述預測信號。

根據本發明，即使在立體聲信號的多個聲道信號之間的相關小的情況下也能夠高效率地將立體聲語音編碼。

附圖說明

圖1是表示本發明的實施方式1的語音編碼裝置的結構的方框圖。

圖2是表示本發明的實施方式1的第一ch、第二ch預測信號合成部分的結構的方框圖。

圖3是表示本發明的實施方式1的第一ch、第二ch預測信號合成部分的結構的方框圖。

圖4是表示本發明的實施方式1的語音解碼裝置的結構的方框圖。

圖5是本發明的實施方式1的語音編碼裝置的動作說明圖。

圖6是本發明的實施方式1的語音編碼裝置的動作說明圖。

圖7是表示本發明的實施方式2的語音編碼裝置的結構的方框圖。

圖8是表示本發明的實施方式2的語音解碼裝置的結構的方框圖。

圖9是表示本發明的實施方式3的語音編碼裝置的結構的方框圖。

圖10是表示本發明的實施方式3的第一ch、第二chCELP編碼部分的結構的方框圖。