[發明專利]聲音信號糾正方法、聲音信號糾正設備以及計算機程序有效
| 申請號: | 200710008338.1 | 申請日: | 2007-01-29 |
| 公開(公告)號: | CN101154384A | 公開(公告)日: | 2008-04-02 |
| 發明(設計)人: | 松尾直司 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G10L21/02 | 分類號: | G10L21/02;G10L19/02;G10L15/20;G10L11/00;G10L11/02 |
| 代理公司: | 隆天國際知識產權代理有限公司 | 代理人: | 張龍哺 |
| 地址: | 日本神奈*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲音 信號 糾正 方法 設備 以及 計算機 程序 | ||
技術領域
本發明涉及一種聲音信號糾正方法、應用所述聲音信號糾正方法的聲音信號糾正設備以及用于實施所述聲音信號糾正設備的計算機程序,其中所述聲音信號糾正方法用于根據與噪聲圖(noise?pattern)相關的噪聲模型糾正基于獲取的聲音的聲音信號。特別地,本發明涉及一種為獲取的聲音提高語音識別率的聲音信號糾正方法、聲音信號糾正設備以及計算機程序。
背景技術
噪聲抑制技術能夠抑制在有噪聲的環境下獲取的聲音中的噪聲成分,其目的用于提高諸如汽車導航器等語音識別設備中的語音識別率,并用于提高與語音相關的設備的質量,例如提高電話機中發送語音的質量。
圖1為在概念上示出傳統噪聲抑制技術的示意圖。根據傳統噪聲抑制技術,獲取包括噪聲和語音的聲音,并通過FFT(快速傅立葉變換)處理,將按幀劃分且基于獲取的聲音的聲音信號、即輸入信號in(n)轉換為相位頻譜tan-1IN(f)和振幅頻譜|IN(f)|。然后,根據與聲音信號的振幅頻譜|IN(f)|具有很高相似度的噪聲模型,估算穩態噪聲的振幅頻譜|N(f)|,并從聲音信號的振幅頻譜|IN(f)|中減去估算的穩態噪聲的振幅頻譜|N(f)|。接著,通過逆FFT處理轉換已減去穩態噪聲的振幅頻譜|N(f)|的振幅頻譜|IN(f)|和相位頻譜tan-1IN(f),從而導出每個幀的輸出信號out(n)。作為其中噪聲被抑制的聲音信號,導出的輸出信號用于例如語音識別處理。
圖2A和圖2B為示出與傳統噪聲抑制技術相關的振幅頻譜的坐標圖。圖2A示出聲音信號的振幅頻譜|IN(f)|中頻率值與振幅值之間的關系,而圖2B示出已減去穩態噪聲的振幅頻譜|N(f)|的振幅頻譜|IN(f)|中頻率值與振幅值之間的關系。在比較圖2A和圖2B時清楚可知,在圖2B所示的波形中已從輸入信號的振幅頻譜|IN(f)|中減去估算的穩態噪聲的振幅頻譜|N(f)|,從而抑制了噪聲。這種噪聲抑制技術稱為譜減法,并且例如在日本專利申請特開平No.07-193548(1995)中公開了使用譜減法的噪聲抑制技術。
然而,噪聲包括隨時間而改變的非穩態成分,從而在日本專利申請特開平No.07-193548(1995)所述的使用譜減法的噪聲抑制技術中,留下非穩態成分。例如,圖2A和圖2B所示的波形涉及僅由噪聲構成的輸入信號,如圖2B所示,在抑制穩態噪聲時,留下高度非穩態噪聲。以這種方式留下的噪聲是非自然噪聲,因此與用于語音識別的聲音模型中包含的噪聲模型的匹配度低,從而導致噪聲識別的精度低之類的問題。具體來說,引起誤差,從而使留下的噪聲被識別為譜功率較低的音位,例如“s”和“n”。因此,對噪聲的抑制與語音識別率的提高不相關;相反地,出現引起語音識別率降低的問題。此外,出現產生音樂噪聲之類的非自然噪聲的問題。
發明內容
為了解決上述問題提出了本發明,并且本發明的目的是提供聲音信號糾正方法、應用所述聲音信號糾正方法的聲音信號糾正設備以及用于實施所述聲音信號糾正設備的計算機程序,其中所述聲音信號糾正方法通過比較聲音信號與噪聲模型并基于比較結果平滑化聲音信號的波形而能夠防止留下非自然噪聲,從而使噪聲識別精度提高、提高語音識別率以及防止產生音樂噪聲。
根據本發明第一方案提供一種聲音信號糾正方法,根據與噪聲圖相關的噪聲模型來糾正基于獲取的聲音的聲音信號,其包括以下步驟:將所述聲音信號與所述噪聲模型進行比較;以及基于比較結果平滑化所述聲音信號的波形。
根據本發明第二方案提供一種聲音信號糾正設備,根據與噪聲圖相關的噪聲模型來糾正基于獲取的聲音的聲音信號,其包括:用于將所述聲音信號與所述噪聲模型進行比較的裝置;以及用于基于比較結果平滑化所述聲音信號的波形的裝置。
根據本發明第三方案提供一種聲音信號糾正設備,根據與噪聲圖的頻譜相關的噪聲模型來糾正基于獲取的聲音的聲音信號的頻譜,其包括:導出裝置,通過將所述聲音信號的頻譜與所述噪聲模型進行比較來導出用于糾正所述聲音信號的糾正系數;以及平滑化裝置,使用導出的糾正系數平滑化所述聲音信號的波形。
根據本發明第四方案提供一種聲音信號糾正設備,在根據第三方案的聲音信號糾正設備中:所述導出裝置根據所述聲音信號的頻譜強度與基于所述噪聲模型確定的閾值之差,導出所述糾正系數。
根據本發明第五方案提供一種聲音信號糾正設備,在根據第三或第四方案的聲音信號糾正設備中:所述平滑化裝置平滑化所述聲音信號的頻譜在頻率軸方向的變化。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710008338.1/2.html,轉載請聲明來源鉆瓜專利網。





