[發明專利]聲音識別裝置以及用于執行聲音識別的方法有效

申請號：	200910007438.1	申請日：	2009-02-13
公開（公告）號：	CN101510425A	公開（公告）日：	2009-08-19
發明（設計）人：	杉山博史;鈴木薰;山本大介;古賀敏之	申請（專利權）人：	株式會社東芝
主分類號：	G10L15/26	分類號：	G10L15/26
代理公司：	中國國際貿易促進委員會專利商標事務所	代理人：	屠長存
地址：	日本***	國省代碼：	日本;JP
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	聲音識別裝置以及用于執行方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

相關申請的交叉參考

本申請涉及包含在2008年2月15日提交的日本專利申請申請第 2008-035126號中的主題，其全部內容通過引用結合于此作為參考。

技術領域

本申請涉及聲音識別裝置，以及用于執行聲音識別的方法。

背景技術

通常，已經知道一種與用戶執行聲音交互的機器人，其被稱作聲音交互機器人。然而，在一些情況下由于從諸如家庭或辦公室的實際環境中的各種設備輸出的噪聲，聲音交互機器人可能不能正確地識別由用戶發出的聲音。為了提高在由家庭電器或用戶的動作發出噪聲的環境中的聲音識別率，優選地由用戶以適當的強度將聲音輸入到傳聲器中。

已經提出了一種用于通過在檢測到用戶聲音時計算S/N比并在 S/N比低于給定值時將機器人移向用戶來改進S/N比的方法。這樣的方法的示例在JP-A-2006-181651(同族美國公開是：US 2006/0143017A1)中被公開。然而，根據該方法，其沒有確定機器人為了接收滿足足以進行聲音識別的S/N比的聲音而需要向用戶移近多少。此外，當周圍噪聲強度改變時，需要接收來自用戶的另一聲音來確定至用戶的距離是否恰當。

已經提出了一種用于向用戶指示實際聲音強度和根據周圍噪聲強度的相對期望聲音強度以使用戶直覺地知道期望的聲音音量的方法。該方法的示例在JP-A-2006-227499中被公開。然而，用戶發出的大量聲音是通過用戶的頭蓋(brainpan)被用戶聽到的。因此，用戶難以根據機器人發出的指示來調節聲音的音量。同樣，當周圍噪聲強度變化時，需要用戶再次發出聲音以接收適當強度范圍內的聲音。

上述傳統方法采用了通過由用戶發出的多個聲音來調節用戶的聲音強度的方法。因此，這些方法需要用戶每次在由于環境變化(諸如周圍噪聲強度的變化)而需要調節的時候再次發出聲音。

發明內容

根據本發明的一個方面，提供了一種語音識別裝置，包括：音頻輸入模塊，其接收音頻輸入，并輸出音頻信號，該音頻輸入模塊具有被配置為可調節的增益；語音識別模塊，在音頻信號中檢測發現用戶的語音出現的語音區間，并對該語音區間期間的音頻信號執行語音識別；第一強度測量模塊，測量語音區間中的音頻信號的信號強度并將測量的信號強度作為語音強度輸出；第二強度測量模塊，測量噪聲區間中的音頻信號的信號強度并將測量的信號強度作為噪聲強度輸出，其中噪聲區間是語音區間之外的時間區間；第一計算模塊，計算作為語音強度與噪聲強度之比的S/N比；距離測量模塊，測量用戶和語音輸入模塊之間的當前距離；第一存儲模塊，存儲對應于語音識別模塊能夠執行具有給定識別率的語音識別的S/N比的第一閾值；第二存儲模塊，存儲具有語音強度、當前距離以及增益的集合的語音特性，通過該語音特性，語音識別模塊成功執行語音識別；第二計算模塊，基于語音特性計算用于當前距離的推薦距離范圍，在該推薦距離范圍內，估算出S/N比超過第一閾值；以及顯示模塊，顯示推薦距離范圍和當前距離。

根據本發明的另一方面，提供了一種執行語音識別的方法，該方法包括：接收音頻輸入以輸出具有被配置為可調節的增益的音頻信號；在音頻信號中檢測發現出現用戶的語音的語音區間以對該語音區間期間的音頻信號執行語音識別；測量語音區間中的音頻信號的信號強度以將測量的信號強度作為語音強度輸出；測量噪聲區間中的音頻信號的信號強度，以將所測量的信號強度作為噪聲強度輸出，該噪聲區間是語音區間之外的時間區間；計算作為語音強度與噪聲強度之比的S/N比；測量距離用戶的當前距離；存儲對應于語音識別模塊能夠執行語音識別以具有給定識別率的S/N比的第一閾值；存儲具有語音強度、當前距離以及增益的集合的語音特性，通過該語音特性，已經成功執行語音識別；基于語音特性計算用于當前距離的推薦距離范圍，在該推薦距離范圍內，估算出S/N比超過第一閾值；以及顯示該推薦距離范圍和當前距離。

附圖說明

將參考附圖描述實施本發明的各種特征的一般配置。提供的附圖及其相關描述是為了示出本發明的實施例，而不用于限制本發明的范圍。

圖1是示出了根據本發明的第一實施例的聲音交互機器人的外觀的示意圖。

圖2是示出了根據第一實施例的聲音交互機器人的使用的示例的示意圖。

圖3是根據第一實施例的聲音交互機器人的功能框圖。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于株式會社東芝，未經株式會社東芝許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/200910007438.1/2.html，轉載請聲明來源鉆瓜專利網。