[發明專利]語音識別方法、語音識別裝置及計算機程序有效
| 申請號: | 200710104539.1 | 申請日: | 2007-05-25 |
| 公開(公告)號: | CN101149923A | 公開(公告)日: | 2008-03-26 |
| 發明(設計)人: | 早川昭二 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G10L15/20 | 分類號: | G10L15/20 |
| 代理公司: | 隆天國際知識產權代理有限公司 | 代理人: | 張龍哺 |
| 地址: | 日本神奈*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 裝置 計算機 程序 | ||
技術領域
本發明涉及語音識別方法,所述方法由通過對聲音進行采樣而獲取的聲音數據來創建預定長度的多個幀,并且基于從各幀提取的特征分量進行語音識別處理。本發明還涉及采用上述語音識別方法的語音識別裝置以及實現該語音識別裝置的計算機程序。本發明尤其涉及用于去除諸如車輛中設置的危機報警閃光器的交替聲(relay?sound)的脈沖噪聲的語音識別方法、語音識別裝置及計算機程序。
背景技術
車載裝置,如汽車導航裝置,通常具有語音識別功能。具有語音識別功能的車載裝置在穩態噪聲(諸如道路噪聲和引擎噪聲)環境下具有高語音識別準確性,但是在突然發生的非穩態噪聲的環境下識別準確性不夠高。特別地,當非穩態噪聲在一段語音中間發生時,則此段語音的識別率會下降。
作為去除非穩態噪聲的方法,日本公開專利申請2003-308092公開了如下技術:獲知噪聲段中以一定周期發生的非穩態噪聲的周期,并在非穩態噪聲疊加于語音段時,從疊加有噪聲的語音功率譜中減去與非穩態噪聲相關的噪聲功率譜。
但是,在日本公開專利申請2003-0308092公開的傳統方法中,當持續時間短、并隨時間快速變化的脈沖噪聲(例如危機報警閃光器的交替聲)作為非穩態噪聲疊加在語音段上時,由于很難在時間分辨率低的功率譜區域準確減去隨時間快速變化的所述脈沖噪聲,因此存在語音識別的正確率下降的問題。
發明內容
本發明旨在解決上述問題,本發明的目的在于提供一種語音識別方法,所述方法可在發生的脈沖噪聲持續時間短并隨時間迅速變化的環境下高度準確地執行語音識別處理,這通過在將被預測疊加有脈沖噪聲的聲音數據或基于所述聲音數據創建的幀刪除后,進行語音識別處理過程來實現。本發明的另一目的在于提供一種采用上述語音識別方法的語音識別裝置。本發明的再一目的在于提供一種用于實現上述語音識別裝置的計算機程序。
根據本發明第一方案,提供一種語音識別方法,該方法根據對聲音進行采樣所獲取的聲音數據而創建預定長度的多個幀,并基于從各個幀中提取的特征分量執行語音識別處理,該方法包括以下步驟:記錄周期性發生的脈沖噪聲的發生周期和持續時間;基于記錄的發生周期和持續時間,預測其中發生脈沖噪聲的段;以及基于除與所預測的段相對應的幀的特征分量之外的剩余幀的特征分量執行語音識別處理。
在本發明中,由于基于脈沖噪聲的發生周期和持續時間預測其中發生脈沖噪聲的段,以及基于除與所預測的段相對應的幀的特征分量之外的剩余幀的特征分量執行語音識別處理,所以所述語音識別處理的執行并不使用受疊加在幀上的脈沖噪聲影響的特征分量。因此,可避免由于脈沖噪聲導致的識別錯誤,而且可在發生脈沖噪聲的環境下高度準確地執行語音識別處理。
根據本發明第二方案,提供一種語音識別方法,該方法根據對聲音進行采樣所獲取的聲音數據而創建預定長度的多個幀,并基于從各個幀中提取的特征分量執行語音識別處理,該方法包括以下步驟:記錄周期性發生的脈沖噪聲的發生周期和持續時間;基于記錄的發生周期和持續時間,預測其中發生脈沖噪聲的段;根據刪除了與所預測的段相對應的部分之后的所述聲音數據創建預定長度的多個幀,以及基于從各個幀中提取的特征分量執行語音識別處理。
在本發明中,由于基于脈沖噪聲的發生周期和持續時間預測其中發生脈沖噪聲的段,根據刪除了與所預測的段相對應的部分的所述聲音數據創建預定長度的多個幀,以及基于從各個幀中提取的特征分量執行語音識別處理,所以所述語音識別處理的執行并不使用受疊加在幀上的脈沖噪聲影響的特征分量。因此,可避免由于脈沖噪聲導致的識別錯誤,而且可在發生脈沖噪聲的環境下高度準確地執行語音識別處理過程。
根據本發明第三方案,提供一種語音識別裝置,包括用于存儲從預定長度的多個幀提取的特征分量的緩沖器,所述多個幀通過對聲音進行采樣所獲取的聲音數據而創建,該語音識別裝置基于存儲在緩沖器中的各個幀的特征分量執行語音識別處理,其中該語音識別裝置包括:記錄部件,用于記錄周期性發生的脈沖噪聲的發生周期和持續時間;預測部件,用于基于在該記錄部件中記錄的發生周期和持續時間,預測其中發生脈沖噪聲的段;以及刪除部件,用于從所述緩沖器中刪除與預測的段相對應的幀的特征分量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710104539.1/2.html,轉載請聲明來源鉆瓜專利網。





