[發明專利]語音識別處理裝置及語音識別處理方法無效
| 申請號: | 201310069457.3 | 申請日: | 2013-03-05 |
| 公開(公告)號: | CN103310791A | 公開(公告)日: | 2013-09-18 |
| 發明(設計)人: | 野中勉 | 申請(專利權)人: | 精工愛普生株式會社 |
| 主分類號: | G10L15/20 | 分類號: | G10L15/20;G10L21/02 |
| 代理公司: | 北京金信立方知識產權代理有限公司 11225 | 代理人: | 黃威;蘇萌萌 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 處理 裝置 方法 | ||
技術領域
本發明涉及一種實施對使用者的語音的識別的語音識別處理裝置。
背景技術
一直以來,存在一種語音處理裝置,其輸入使用者的語音,并對語音進行分析從而實施與使用者相對應的處理。這種裝置例如被用于電話應答系統、實施美術館等的館內的引導的引導系統以及車輛導航系統等。雖然使用者的語音會通過話筒而被導入到語音處理裝置中,然而在多數情況下,使用者的周圍的聲音也會被同時導入。這種周圍的聲音,在實施對使用者的語音的識別的過程中會構成噪聲,從而成為使語音識別率降低的主要因素。
因此,進行了各種研究來實施用于去除周圍聲音的預定的處理。例如,在專利文獻1中,記載了一種如下的噪聲抑制裝置,該噪聲抑制裝置在每個固定區間內提取語音輸入信號并對語音區間和無語音區間進行區分,并且通過對無語音區間內的頻譜進行平均化從而持續對噪聲頻譜進行推斷和更新。
但是,由于專利文獻1的噪聲抑制裝置需要始終導入周圍的聲音且持續推斷并更新無語音區間內的輸入信號的頻譜,因此需要在語音識別處理的執行過程中使噪聲抑制裝置持續工作,從而認為上述情況將成為阻礙消耗電力降低化的主要因素之一。此外,雖然在每個預定的固定區間進行提取并實施其為語音區間或無語音區間的判斷,然而由于使用者的發聲的時刻并非按照該預定的固定區間來實施,因此存在混入了少許語音的、并非為完全的無語音區間的區間也被判斷為無語音區間的情況,并且認為當這種情況增多時有時會導致噪聲頻譜并非優選。
此外,裝置周圍的狀態并不一定總處于相同的狀態。因此,認為存在如下情況,即,不存在使用者時的無語音區間內的噪聲、和存在使用者時的噪聲較大程度地不同的情況。在包括不存在使用者時的預定的固定區間內的噪聲頻譜在內的條件下持續進行推斷和更新,有時會有在實施語音識別時成為并非優選的噪聲頻譜的可能性。
專利文獻1:日本特開2004-20679號公報
發明內容
本發明是為了解決上述課題中的至少一部分而實施的發明,其能夠作為以下的方式或應用例來實現。
應用例1
本應用例所涉及的語音識別處理裝置的特征在于,包括:語音合成部;語音輸出部,其輸出在所述語音合成部中所合成的語音;語音輸入部;語音識別部,其實施針對從所述語音輸入部輸入的聲音的語音識別,在所述語音合成部中被合成的第一句子包括第一單詞和第二單詞,在將所述語音合成部中合成有所述第一單詞的聲音設為第一合成音、將所述語音合成部中合成有所述第二單詞的聲音設為第二合成音時,以在第一期間和第二期間之間的第三期間內通過所述語音輸入部而被輸入的聲音為基礎,來生成補正信息,其中,所述第一期間為輸出所述第一合成音的期間,所述第二期間為輸出所述第二合成音的期間,所述第三期間為未通過所述語音輸出部而輸出語音的期間,所述補正信息為,用于對實施所述語音識別的語音信號進行噪聲去除的信息。
根據該結構,由于通過根據在第三期間內所輸入的聲音的信號,來生成用于噪聲去除的補正信息,并將其用于語音識別時的聲音的信號的噪聲去除,且所述第三期間為,在語音合成部中所合成的第一合成音和第二合成音之間的、未輸出語音的期間,從而不需要始終實施用于實施噪聲去除的信號生成的處理,因此與始終實施噪聲去除的方式相比,能夠實現消耗電力的降低化。
此外還認為,在作為合成音的輸出間隙的期間的第三期間內,使用者發出語音的可能性較低,從而結果成為不含有使用者的語音的無語音區間的情況較多。因此,在以預定的固定區間來分割時所計算出的噪聲頻譜、和在第三期間內所計算出的噪聲頻譜中,在第三期間內所計算出的噪聲頻譜中使用者的語音頻譜的成分較少。由此能夠判斷為,根據在第三期間內被輸入的聲音的信號來使用被用于噪聲去除的補正信息,具有進一步提高語音識別率的效果。
此外,例如,在以與使用者的對話形式實施處理的情況下,在語音識別處理裝置輸出通過語音合成而形成的語音時,是存在使用者之時。因此,在以第三期間內所輸入的聲音的信號為基礎而生成的用于噪聲去除的補正信息中,不包含不存在使用者時所發出的周圍的聲音的信息。因此,能夠判斷為具有進一步提高語音識別率的效果。
應用例2
在上述應用例所涉及的語音識別處理裝置中,優選為,所述第二單詞為所述第一單詞的下一個單詞。
根據該結構,通過使第二單詞為第一單詞的下一個單詞,從而能夠將第三期間設為連續的兩個單詞之間的期間,進而能夠使第三期間的設定變得容易。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于精工愛普生株式會社,未經精工愛普生株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310069457.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種非揮發性內存結構及其方法
- 下一篇:驅動裝置及驅動方法





