[發明專利]聲音識別裝置以及用于執行聲音識別的方法有效
| 申請號: | 200910007438.1 | 申請日: | 2009-02-13 |
| 公開(公告)號: | CN101510425A | 公開(公告)日: | 2009-08-19 |
| 發明(設計)人: | 杉山博史;鈴木薰;山本大介;古賀敏之 | 申請(專利權)人: | 株式會社東芝 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 | 代理人: | 屠長存 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲音 識別 裝置 以及 用于 執行 方法 | ||
相關申請的交叉參考
本申請涉及包含在2008年2月15日提交的日本專利申請申請第 2008-035126號中的主題,其全部內容通過引用結合于此作為參考。
技術領域
本申請涉及聲音識別裝置,以及用于執行聲音識別的方法。
背景技術
通常,已經知道一種與用戶執行聲音交互的機器人,其被稱作聲 音交互機器人。然而,在一些情況下由于從諸如家庭或辦公室的實際 環境中的各種設備輸出的噪聲,聲音交互機器人可能不能正確地識別 由用戶發出的聲音。為了提高在由家庭電器或用戶的動作發出噪聲的 環境中的聲音識別率,優選地由用戶以適當的強度將聲音輸入到傳聲 器中。
已經提出了一種用于通過在檢測到用戶聲音時計算S/N比并在 S/N比低于給定值時將機器人移向用戶來改進S/N比的方法。這樣的 方法的示例在JP-A-2006-181651(同族美國公開是:US 2006/0143017A1)中被公開。然而,根據該方法,其沒有確定機器 人為了接收滿足足以進行聲音識別的S/N比的聲音而需要向用戶移近 多少。此外,當周圍噪聲強度改變時,需要接收來自用戶的另一聲音 來確定至用戶的距離是否恰當。
已經提出了一種用于向用戶指示實際聲音強度和根據周圍噪聲強 度的相對期望聲音強度以使用戶直覺地知道期望的聲音音量的方法。 該方法的示例在JP-A-2006-227499中被公開。然而,用戶發出的大 量聲音是通過用戶的頭蓋(brainpan)被用戶聽到的。因此,用戶難 以根據機器人發出的指示來調節聲音的音量。同樣,當周圍噪聲強度 變化時,需要用戶再次發出聲音以接收適當強度范圍內的聲音。
上述傳統方法采用了通過由用戶發出的多個聲音來調節用戶的聲 音強度的方法。因此,這些方法需要用戶每次在由于環境變化(諸如 周圍噪聲強度的變化)而需要調節的時候再次發出聲音。
發明內容
根據本發明的一個方面,提供了一種語音識別裝置,包括:音頻 輸入模塊,其接收音頻輸入,并輸出音頻信號,該音頻輸入模塊具有 被配置為可調節的增益;語音識別模塊,在音頻信號中檢測發現用戶 的語音出現的語音區間,并對該語音區間期間的音頻信號執行語音識 別;第一強度測量模塊,測量語音區間中的音頻信號的信號強度并將 測量的信號強度作為語音強度輸出;第二強度測量模塊,測量噪聲區 間中的音頻信號的信號強度并將測量的信號強度作為噪聲強度輸出, 其中噪聲區間是語音區間之外的時間區間;第一計算模塊,計算作為 語音強度與噪聲強度之比的S/N比;距離測量模塊,測量用戶和語音 輸入模塊之間的當前距離;第一存儲模塊,存儲對應于語音識別模塊 能夠執行具有給定識別率的語音識別的S/N比的第一閾值;第二存儲 模塊,存儲具有語音強度、當前距離以及增益的集合的語音特性,通 過該語音特性,語音識別模塊成功執行語音識別;第二計算模塊,基 于語音特性計算用于當前距離的推薦距離范圍,在該推薦距離范圍 內,估算出S/N比超過第一閾值;以及顯示模塊,顯示推薦距離范圍 和當前距離。
根據本發明的另一方面,提供了一種執行語音識別的方法,該方 法包括:接收音頻輸入以輸出具有被配置為可調節的增益的音頻信 號;在音頻信號中檢測發現出現用戶的語音的語音區間以對該語音區 間期間的音頻信號執行語音識別;測量語音區間中的音頻信號的信號 強度以將測量的信號強度作為語音強度輸出;測量噪聲區間中的音頻 信號的信號強度,以將所測量的信號強度作為噪聲強度輸出,該噪聲 區間是語音區間之外的時間區間;計算作為語音強度與噪聲強度之比 的S/N比;測量距離用戶的當前距離;存儲對應于語音識別模塊能夠 執行語音識別以具有給定識別率的S/N比的第一閾值;存儲具有語音 強度、當前距離以及增益的集合的語音特性,通過該語音特性,已經 成功執行語音識別;基于語音特性計算用于當前距離的推薦距離范 圍,在該推薦距離范圍內,估算出S/N比超過第一閾值;以及顯示該 推薦距離范圍和當前距離。
附圖說明
將參考附圖描述實施本發明的各種特征的一般配置。提供的附圖 及其相關描述是為了示出本發明的實施例,而不用于限制本發明的范 圍。
圖1是示出了根據本發明的第一實施例的聲音交互機器人的外觀 的示意圖。
圖2是示出了根據第一實施例的聲音交互機器人的使用的示例的 示意圖。
圖3是根據第一實施例的聲音交互機器人的功能框圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社東芝,未經株式會社東芝許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910007438.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:盤裝置
- 下一篇:可移去的首字母標識片





