[發明專利]語音識別裝置有效
| 申請號: | 200810166355.2 | 申請日: | 2008-09-26 |
| 公開(公告)號: | CN101458928A | 公開(公告)日: | 2009-06-17 |
| 發明(設計)人: | 阿部賢司 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G10L15/08 | 分類號: | G10L15/08;G10L15/18 |
| 代理公司: | 北京三友知識產權代理有限公司 | 代理人: | 李 輝 |
| 地址: | 日本神奈*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 裝置 | ||
技術領域
本發明涉及語音識別裝置以及存儲有用于實現該語音識別裝置的計 算機程序的存儲產品,該語音識別裝置用于按發音單元識別基于發聲法 的語音數據,參照存儲有多個具有一個或多個發音單元的短語的短語數 據庫,比較按發音單元識別的結果與存儲在短語數據庫中的短語,并且 識別所述語音數據中包括的由一個或多個發音單元組成的短語。
背景技術
語音識別處理已經付諸于實際的應用,用于針對基于說話者產生的 語音的語音數據而生成基于發聲內容的文本數據。該語音識別處理生成 的文本數據實際用于各種應用,舉例來說,如在呼叫中心記錄對話內容 的語音打字處理。文本數據也可以按詞單元生成,且例如用作在呼叫中 心處總結對話內容的關鍵詞,從而進一步用于檢索相關內容。
在語音識別處理中,在通過分析基于發聲法的語音數據而獲得的特 征量的基礎上,按發音單元如音節識別語音,并且例如,在諸如詞辨別 (Word?Spotting)的方法中,通過參照列出短語的詞典執行匹配操作,把 語音識別為詞典中列出的短語。例如,作為提高識別率的方法,在日本 特開專利公報No.11-7292中公開了增加詞匯的技術。
發明內容
因此,本發明的一個目的是提供一種能夠減少基于由少量音節組成 的短語的誤識別的語音識別裝置。
根據本發明的一個方面,提供一種語音識別裝置,其用于執行按發 音單元識別基于發聲法的語音數據的第一識別處理,參照存儲有多個由 一個或多個發音單元組成的短語的短語數據庫,將該第一識別處理的結 果與該短語數據庫中存儲的短語進行比較,并且執行識別所述語音數據 中包括的由一個或多個發音單元組成的短語的第二識別處理。該語音識 別裝置包括優先級識別部,該優先級識別部用于將該第一識別處理的結 果與通過在存儲在該短語數據庫中的相應短語之前和/或之后添加附加短 語而獲得的多個擴展短語進行比較,以優先于該第二識別處理,識別包 括在該語音數據中的擴展短語,其中,所述優先級識別部基于所述第一 識別處理的結果識別擴展短語,而所述第二識別處理是根據所述優先級 識別部識別出的擴展短語來執行的。
根據本發明的另一方面,提供了一種語音識別裝置,其用于執行按 發音單元識別基于發聲法的語音數據的第一識別處理,將該第一識別處 理的結果與在存儲有多個具有一個或多個發音單元的短語的短語數據庫 中存儲的多個短語進行比較,并且執行識別所述語音數據中包括的由一 個或多個發音單元組成的短語的第二識別處理,其特征在于包括:擴展 短語數據庫,其用于存儲通過在存儲在所述短語數據庫中的相應短語之 前和/或之后添加附加短語而獲得的多個擴展短語;用于從所述短語數據 庫提取具有預定發音單元數的短語的短語提取部;用于從所述擴展短語 數據庫提取通過向提取的短語添加附加短語而獲得的擴展短語的擴展短 語提取部;以及優先級識別部,其用于優先于所述第二識別處理,將所 述第一識別處理的結果與提取的擴展短語進行比較,以識別所述語音數 據中包括的擴展短語,其中,所述優先級識別部基于所述第一識別處理 的結果識別擴展短語,而所述第二識別處理是根據所述優先級識別部識 別出的擴展短語來執行的。
附圖說明
圖1A、1B和1C是用于概念性地示出語音識別處理中的誤識別的示 例的說明圖;
圖2是用于示出根據一個實施方式的語音識別裝置的配置的框圖;
圖3是用于概念性地示出根據該實施方式的語音識別裝置中設置的 詞形變化(conjugation)詞典數據庫的存儲內容的說明圖;
圖4是用于概念性地示出根據該實施方式的語音識別裝置中設置的 同現詞典數據庫的存儲內容的說明圖;
圖5是用于示出根據該實施方式的語音識別裝置的語音識別處理的 操作流程;
圖6是用于示出根據該實施方式的語音識別裝置的短語擴展處理的 操作流程;
圖7是用于概念性地示出根據該實施方式的語音識別裝置的短語擴 展處理的直方圖;
圖8A、8B、8C和8D是用于概念性地示出根據該實施方式的語音識 別裝置在英語識別中的應用示例的說明圖;以及
圖9A、9B、9C和9D是用于概念性地示出根據該實施方式的語音識 別裝置在漢語識別中的應用示例的說明圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810166355.2/2.html,轉載請聲明來源鉆瓜專利網。





