[發明專利]彎曲譜和精細估計音頻編碼有效
| 申請號: | 201110415397.7 | 申請日: | 2011-12-02 |
| 公開(公告)號: | CN102568484A | 公開(公告)日: | 2012-07-11 |
| 發明(設計)人: | M·L·塞爾澤;J·G·德羅珀;H·S·瑪爾瓦;A·阿塞羅;樊星 | 申請(專利權)人: | 微軟公司 |
| 主分類號: | G10L19/00 | 分類號: | G10L19/00;G10L15/00 |
| 代理公司: | 上海專利商標事務所有限公司 31100 | 代理人: | 陳斌 |
| 地址: | 美國華*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 彎曲 精細 估計 音頻 編碼 | ||
技術領域
本發明涉及音頻編解碼。
背景技術
諸如在移動電話和IP語音(VOIP)網絡中所使用的那些典型的語音編解碼器使用設計來改善人類聽者的感知質量而非語音識別性能的方案來對原始的語音信號編碼。相反,語音識別系統通常使用設計來改善語音識別性能的方案來對諸如彎曲頻譜估計表示(此處也稱為彎曲譜估計)之類的語音識別特征進行編碼。一些方案嘗試使用已編碼語音識別特征來構造音頻信號,而一些方案嘗試使用已編碼的語音編解碼器特征來進行語音識別。
發明內容
先前嘗試使用已編碼語音識別特征來構造音頻信號僅取得了有限的成功,導致所構造的音頻信號并非原始音頻信號的接近表示。類似地,先前嘗試使用已編碼的語音編解碼器特征來用于語音識別也取得了有限的成功。此處所描述的工具和技術可包括使用原始音頻信號的彎曲譜估計以對原始信號的精細特征的精細估計進行編碼。彎曲譜估計的表示可用于語音識別,并且還可與精細估計的表示一起被用于重構表示原始音頻信號的重構音頻信號。
如此處所使用的,原始音頻信號或原始語音信號是用于編碼彎曲譜估計表示的音頻信號。原始信號可以是未經處理的音頻信號,或者采用多種方式中的一種或多種進行預處理后的音頻信號。彎曲譜估計是音頻信號的頻域估計,該音頻信號通過改變由頻譜表示的頻率組范圍而被彎曲。平滑估計是提供關于對應的音頻信號的高級(或粗略)細節的經平滑的估計。精細估計是原始音頻信號的波形的精細細節的估計,其中精細細節比用于編碼精細估計的平滑估計中所提供的細節更精細。精細估計不僅僅是諸如基音信息——其提供了與音頻波形的特征有關的一些細節——之類的信息,而且實際上并不估計波形的精細細節。重構的音頻信號是從原始音頻信號的估計中構造的信號,因而該重構的音頻信號表示原始音頻信號的近似。
在一實施例中,本發明的工具和技術可包括對來自原始音頻信號的彎曲頻譜估計的表示進行編碼。該編碼可基于彎曲頻譜并可包括動態范圍縮減操作。原始音頻信號的平滑估計的表示可使用彎曲頻譜估計表示來生成。此外,原始音頻信號的精細細節的精細估計表示可使用平滑估計的表示來編碼。
在本發明的工具和技術的另一實施例中,原始音頻信號的彎曲頻譜估計的表示可以被解碼。原始音頻信號的精細估計的表示也可以被解碼。可將彎曲頻譜估計的表示傳遞至語音識別引擎。此外,可使用彎曲頻譜估計的表示和精細估計的表示來重構表示原始音頻信號的音頻信號。重構可包括擴展彎曲頻譜估計的表示的動態范圍。
提供本發明內容是為了以簡化的形式介紹一些概念。這些概念將在以下具體實施方式中進一步描述。本發明內容并不旨在標識所要求保護主題的關鍵特征或必要特征,也不旨在用于限制所要求保護主題的范圍。類似地,本發明不限于解決在背景技術、具體實施方式、或附圖中討論的特定技術、工具、環境、缺點、或優點的實現。
附圖說明
圖1是其中可實現所描述的各實施例中的一個或多個實施例的合適的計算環境的框圖。
圖2是音頻編碼系統的示意圖。
圖3是語音識別系統的示意圖。
圖4是用于彎曲譜和精細估計音頻編碼的技術的流程圖。
圖5是用于彎曲譜和精細估計音頻編碼的另一技術的流程圖。
圖6是用于彎曲譜和精細估計音頻編碼的又一技術的流程圖。
具體實施方式
此處所描述的實施例涉及用于音頻特征的經改進的編碼/解碼的技術和工具,諸如可用在語音識別中以及也可用在音頻信號重構中的特征的經改進的編碼/解碼。這樣的改善可源于分開或組合地使用各種技術和工具。
這樣的技術和工具可以包括使用彎曲譜估計——其傳統上已被用于語音識別——以對原始音頻信號的精細估計進行編碼。可將彎曲譜估計的表示和精細估計的表示發送至語音識別系統并將其用于語音識別以及重構原始音頻信號的表示。例如,可將彎曲譜估計表示傳遞至語音識別引擎。此外,彎曲譜估計表示可與精細估計表示一起使用以重構音頻信號的表示。例如,彎曲譜估計表示可用于生成平滑估計,其可與精細估計組合以對表示原始音頻信號的重構音頻信號進行編碼。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟公司,未經微軟公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110415397.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電子通信優先分配
- 下一篇:去除測序文庫中的載體片段的方法





