[發明專利]識別裝置、識別方法、生成裝置和生成方法無效
| 申請號: | 201210313705.X | 申請日: | 2012-08-29 |
| 公開(公告)號: | CN103050115A | 公開(公告)日: | 2013-04-17 |
| 發明(設計)人: | 原田將治 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G10L15/10 | 分類號: | G10L15/10 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 康建峰;唐京橋 |
| 地址: | 日本神*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 識別 裝置 方法 生成 | ||
技術領域
在此討論的實施例針對的是識別裝置、識別程序、識別方法、生成裝置、生成程序和生成方法。
背景技術
存在使用文件或網絡頁面中包括的文本來識別輸入語音的裝置。上述裝置的例子包括這樣一種裝置,該裝置計算指示輸入語音的語音信號和文本中包括的詞或其中詞被連接的字符串之間的相似度,并且將計算的相似度超過閾值時的詞或字符串判斷為對應于語音信號的詞或字符串。
進一步,使用文本來識別輸入語音的裝置的另一個例子包括這樣一種裝置,該裝置生成文本中包括的詞的所有連接模式,并且將生成的連接模式登記在詞典(dictionary)中,所述詞典可以用來識別語音以生成詞典。生成詞典的裝置將詞典中登記的連接模式與指示輸入語音的語音信號相比較以識別語音。另外,當文本中包括的詞的數目為n時,生成詞典的裝置生成多至1至n之和的連接模式。
進而,使用文本來識別輸入語音的裝置的另一個例子包括通過N元語法(N-gram)來重新訓練語言模型的裝置。相對于從語料庫訓練的語言模型,重新訓練語言模型的裝置增加了文本中的連接詞相對于其中詞被連接的詞串的概率。在這種情況下,重新訓練語言模型的裝置生成了多至文本中出現的詞的數目的N次冪的模式,并且使用生成的模式增加了相對于語言模型連接的詞的概率。
專利文件1:日本公開專利公布第2002-41081號
專利文件2:日本公開專利公布第2002-342323號
然而,根據現有技術的裝置沒有精確地識別語音。根據特定的例子,當沒有登記在詞典中作為連接模式的語音被輸入時,上面提到的生成詞典的裝置的輸入語音的識別結果的精確度低。這是因為即使文本中包括的相鄰詞的組合的模式包括在詞典中登記的連接模式中,包括在文本中但不彼此相鄰的詞的組合的模式并沒有包括在詞典中登記的連接模式中。
進一步,在上面提到的重新訓練語言的裝置中,由于模式被生成得多至文本中出現的詞的數目的N次冪,所以將要生成的模式的信息量很大。
因此,本發明的實施例的一方面的目標是要提供能夠精確地識別語音的識別裝置、識別程序、識別方法、生成裝置、生成程序和生成方法。
發明內容
根據實施例的一方面,一種識別裝置包括存儲器和耦合到存儲器的處理器。存儲器存儲語句中包括的詞和指示詞在語句中的位置的位置信息。處理器執行包括以下步驟的過程:將輸入語音信號與連接存儲器中存儲的多個詞的字符串的閱讀信息相比較以計算相似度;基于存儲器中存儲的詞的位置信息,計算指示多個連接的詞之間接近度的連接得分;以及基于相似度和連接得分,確定對應于語音信號的字符串。
附圖說明
圖1是圖示根據第一實施例的包括識別裝置和生成裝置的系統的配置例子的示圖;
圖2是圖示根據第一實施例的生成裝置的功能配置例子的示圖;
圖3是圖示詞典的例子的示圖;
圖4是圖示根據第一實施例的識別裝置的功能配置例子的示圖;
圖5是圖示根據第一實施例的生成處理序列的流程圖;
圖6是圖示根據第一實施例的識別處理序列的流程圖;
圖7是圖示根據第二實施例的生成裝置的功能配置例子的示圖;
圖8是圖示詞典的例子的示圖;
圖9是圖示根據第二實施例的識別裝置的功能配置例子的示圖;
圖10是圖示根據第二實施例的生成處理序列的流程圖;
圖11是圖示根據第二實施例的識別處理序列的流程圖;
圖12是圖示根據第三實施例的識別裝置的功能例子的示圖;
圖13是圖示語言模型的例子的示圖;
圖14是圖示詞詞典(word?dictionary)的例子的示圖;
圖15是圖示根據第三實施例的識別處理序列的流程圖;
圖16是圖示根據第四實施例的生成裝置的配置例子的示圖;
圖17是圖示詞類號碼表的例子的示圖;
圖18是圖示詞典的例子的示圖;
圖19是圖示根據第四實施例的識別裝置的配置例子的示圖;
圖20是圖示概率表的例子的示圖;
圖21是圖示根據第四實施例的生成處理序列的流程圖;
圖22是圖示根據第四實施例的識別處理序列的流程圖;
圖23是圖示執行生成程序的計算機的示圖;以及
圖24是圖示執行識別程序的計算機的示圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210313705.X/2.html,轉載請聲明來源鉆瓜專利網。





