[發明專利]語音識別裝置、語音識別方法及語音識別程序無效

申請號：	200880006579.5	申請日：	2008-02-26
公開（公告）號：	CN101622660A	公開（公告）日：	2010-01-06
發明（設計）人：	荒川隆行;花澤健;辻川剛范	申請（專利權）人：	日本電氣株式會社
主分類號：	G10L15/10	分類號：	G10L15/10;G10L15/02;G10L15/06;G10L15/08;G10L15/14
代理公司：	中科專利商標代理有限責任公司	代理人：	汪惠民
地址：	日本***	國省代碼：	日本;JP
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語音識別裝置方法程序
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

【0001】

本發明主張在先的日本專利申請2007-048898號(2007年2月28日申請)的優先權，所述在先申請的全部記載內容被認為在本說明書中通過引用而編入記載。

本發明涉及一種識別語音的語音識別裝置、語音識別方法及語音識別程序，特別是涉及一種通過判斷音響特性來控制語音識別相關的參數從而用較少的計算成本就能提高語音識別的識別精度的語音識別裝置、語音識別方法及語音識別程序。

背景技術

【0002】

一般，利用語音識別裝置來進行：對輸入的語音進行語音識別并變換為文本(text)等加以利用。作為以往的語音識別裝置，例如在專利文獻1中記載了如下的裝置：不增加計算成本，抑制對正解剪枝，從而以較高的識別精度進行語音識別。另外，例如在非專利文獻1中記載了一般的語音識別技術的手法及語音識別的實時技術。

【0003】

專利文獻1：日本特開2001-75596號公告(段落0063～0070、圖6～8)

非專利文獻1：安藤彰男著、「リアルタイム音聲認識」、電子情報通信學會、pp.28-p.143

【0004】

以上的專利文獻1及非專利文獻1的公開事項在本說明中通過引用而編入記載。以下給出本發明關聯技術的分析。

圖12是表示利用了非專利文獻1中記載的語音識別技術的一般語音識別裝置的構成例的框圖。如圖12所示，一般，語音識別裝置包括：輸入信號取得部91、特征量計算部92、音響模型93、語言模型94、網絡搜索部95、和識別結果輸出部96。

【0005】

輸入信號取得部91將輸入信號(語音信號)按每單位時間進行切分并取得(輸入)。特征量計算部92根據輸入信號取得部91輸入的輸入信號計算特性量。音響模型93預先存儲音響模型。語言模型94預先存儲語言模型。網絡搜索部95基于用特征量計算部92計算的特征量、音響模型93存儲的音響模型、及語言模型94存儲的語言模型來搜索作為語音識別結果的單詞串的候補。識別結果輸出部96輸出在網絡搜索部中搜索到的單詞串的候補。

【0006】

在圖12示出的一般的語音識別裝置中，在用網絡搜索部95搜索單詞串時，利用用特征量計算部92計算的特征量、存儲在音響模型存儲部93中的音響模型、及存儲在語言模型存儲部94中的語言模型。首先，網絡搜索部95通過進行單詞串的搜索處理求出公式(1)中所示似然度最高的單詞串。

【0007】

【公式1】

ω^=ω0,...,ωm]]>式(1)

【0008】

此時，若利用在非專利文獻1中公開的搜索(search)方法(參照非專利文獻1的第6章)，則在按照時間序列順序給出輸入信號x＝x

0，...，x?T時，網絡搜索部95能夠利用式(2)求出似然度最高的單詞串。

【0009】

【公式2】

ω^=argmax{logP(x|ω)+λlogP(ω)}]]>式(2)