[發明專利]基于AMR-NB語音信號的可變碼率編碼器和解碼器及其編碼和解碼方法有效
| 申請號: | 201310461595.6 | 申請日: | 2013-09-30 |
| 公開(公告)號: | CN104517612B | 公開(公告)日: | 2018-10-12 |
| 發明(設計)人: | 須澤中;郝飛;盧家義 | 申請(專利權)人: | 上海愛聊信息科技有限公司 |
| 主分類號: | G10L19/24 | 分類號: | G10L19/24 |
| 代理公司: | 上海浦一知識產權代理有限公司 31211 | 代理人: | 丁紀鐵 |
| 地址: | 200235 上海市徐匯*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 amr nb 語音 信號 可變 編碼器 解碼器 及其 編碼 解碼 方法 | ||
本發明公開了一種基于AMR?NB語音信號的可變碼率編碼器,包括:預處理單元,將語音信號數值化形成語音幀;語音幀質量判定單元,判定當前語音幀的質量等級給予語音幀各自的編碼模式和目標比特率;編碼模式選擇單元,根據質量等級選擇語音幀編碼模式;比特率確定單元,根據編碼模式來確定語音幀的目標比特率;碼激勵線性預測編碼單元,根據語音幀目標比特率對語音幀執行編碼形成編碼后的語音幀。本發明還公開了一種與所述編碼器對應使用的可變碼率解碼器,以及一種可變碼率編碼方法和一種可變碼率解碼方法。本發明相較于AMR的碼率更低,能根據語音幀內容實現可變碼率,能通過設置信道的語音質量,根據語音幀內容的重要性判定來選擇所需要的編碼速率模式。
技術領域
本發明涉及通信領域,特別是涉及一種在移動互聯網通信語音技術中基于AMR-NB語音信號的可變碼率編碼器;本發明還涉及一種與所述編碼器對應使用的基于AMR-NB語音信號的可變碼率解碼器,以及一種基于AMR-NB語音信號的可變碼率編碼方法和一種基于AMR-NB語音信號的可變碼率解碼方法。
背景技術
在諸如移動互聯網上語音的各種應用領域中,對在主觀質量和比特率之間具有好的、平衡的、高效的數字窄帶語音編碼技術的需求正在增加。主觀質量級別通常由為輸入流的已編碼的語音部分所指定的比特率來規定。較高的比特率通常指示關于原始語音的較大量信息被編碼和保留,并且因此在語音回放期間將呈現原始輸入語音的更準確的再現。相反,較低的比特率指示關于原始輸入語音的較少信息被編碼和保留,并且因此在語音回放期間將呈現原始語音的不太準確的再現。
自適應多速率(Adaptive Multi Rate,AMR)是由3GPP(3rd GenerationPartnership Project)制定的第三代移動通訊系統中的語音編解碼技術。窄帶自適應多速率(AMR-NB)編解碼器支持八種速率:12.2kbit/s,10.2kbit/s,7.95kbit/s,7.40kbit/s,6.7kbit/s,5.9kbit/s,5.15kbit/s,4.75kbit/s,此外它還包括低速率1.8kbit/s背景噪聲模式。實際的語音編碼速率取決于信道的條件,AMR-NB語音編碼可根據無線信道和傳輸狀況自適應地選擇一種最佳信道模式和編碼模式來進行編碼傳輸。當信道質量差時,采用低的編碼速率,這樣信道編碼中的冗余比特就會增加,從而對信息更好的保護;當信道質量好時,可以采用高的編碼速率來提高語音的質量。但是,當帶寬固定和信道環境平衡的信道中,編碼速率將是固定不變的,每幀語音內容卻有重要和不重要之分,如果用一樣的碼率來編碼全部的語音幀,將會增加多余的比特在信道中傳輸,即使減少這些冗余比特,也不會對主觀聲音質量造成影響。
碼激勵線性預測(CELP)編碼是能夠在主觀質量和比特率之間獲得好的折中的已知技術。該編碼技術是無線和有線應用中幾個語音編碼標準的基礎。CELP語音編碼算法用線性預測提取聲道參數,用一個包含許多典型的激勵矢量的碼本作為激勵參數,每次編碼時都在這個碼本中搜索一個最佳的激勵矢量,這個激勵矢量的編碼值就是這個序列的碼本中的序號。激勵信號特征的參數被傳送到解碼器,其中重建的激勵信號被用作線性預測(LP)濾波器的輸入。
根據3GPP TS26.090,自適應多速率(AMR)編解碼方式中采用的碼書激勵線性預測編碼器將一個語音信號幀分成若干個子幀,進行線性預測和量化,自適應碼書搜索和量化以及固定碼書搜索和量化。AMR-NB(自適應多速率窄帶)語音編碼支持最低的編碼速率模式4.75kbps來進行語音編解碼,在實際移動通訊互聯網的應用中,帶寬頻率資源變得愈加寶貴,更低碼率的編解碼器將更顯的重要。
根據3GPP TS26.101,AMR幀分為三部分:幀類型、語音和噪聲數據構成的AMR核心幀、比特填充。進一步,AMR核心幀根據數據重要性又分成三種類型:類型A、類型B和類型C。類型A數據的正確性是保證語音質量的關鍵,類型B和類型C相較于類型A就顯得不那么重要,如果判定的語音幀內容不重要的時候,適當的降低類型B和類型C的比特對主觀質量不會有影響。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海愛聊信息科技有限公司,未經上海愛聊信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310461595.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:圖案形成方法、和磁記錄介質的制造方法
- 下一篇:鼓用消音器





