[發明專利]聲音識別服務器綜合裝置以及聲音識別服務器綜合方法有效

申請號：	201380018950.0	申請日：	2013-04-03
公開（公告）號：	CN104221078B	公開（公告）日：	2016-11-02
發明（設計）人：	大淵康成;本間健	申請（專利權）人：	歌樂株式會社
主分類號：	G10L15/32	分類號：	G10L15/32;G10L15/30
代理公司：	中科專利商標代理有限責任公司 11021	代理人：	趙琳琳
地址：	日本國***	國省代碼：	日本;JP
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	聲音識別服務器綜合裝置以及方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及將用于用戶使用聲音來進行操作的終端裝置、和識別聲音數據并返回其結果的多個聲音識別服務器相連，對由多個聲音識別服務器得到的識別結果進行綜合從而將最佳的聲音識別結果提供給用戶用的裝置以及方法。

背景技術

用于通過用戶的聲音來進行車載信息設備或便攜電話等的操作的聲音識別功能被搭載在眾多的設備中。進而，近年來，通過數據通信技術的發展，將聲音數據發送到服務器并利用服務器的豐富的計算資源來進行更高精度的聲音識別的方式不斷普及。此外，如專利文獻1所示那樣，為了更有效地使用這樣的聲音識別服務器，還提出在個人用終端與聲音識別服務器之間設置中繼服務器并在其中進行附加的處理的方式。

在先技術文獻

專利文獻

專利文獻1：JP特開2008-242067號公報

專利文獻2：JP特開2002-116796號公報

專利文獻3：JP特開2010-224301號公報

發明內容

發明要解決的課題

將聲音識別服務器作為通用的服務來運營的例子增加，提供面向用戶所操縱的終端的服務的主體、和運營聲音識別服務器的主體不同的情況也變多。此外，在運營主體相同的情況下，也有分開進行聲音識別服務器的開發和聲音識別應用的開發，它們相互未被最優化的情況。在這樣的狀況下，有時通用的聲音識別服務器總體表現出高的性能，但對特定的語句卻未必表現出充分的性能。

另一方面，在著眼于使用特定的應用的特定的用戶的情況下，存在該用戶的熟人的姓名或喜歡的音樂的樂曲名等雖然不普遍但重要度卻高的語句。為了識別這樣的語句，期望設置專用的聲音識別服務器，但在專用聲音識別服務器的開發中不能投入足夠的成本的情況較多，在針對一般的語句的性能中要遜于通用聲音識別服務器。如此，通用聲音識別服務器和專用聲音識別服務器因語句不同在識別上有擅長和不擅長，聲音識別性能不同。因此，雖然尋求根據用戶發出的語句來區分使用它們的方法，但只要所謂聲音識別是“針對不知道內容的發聲來估計內容的”任務，則在原理上就不能實現事前獲知發聲內容來區分使用服務器。

本發明目的在于，提供以最佳形式對通用聲音識別服務器的聲音識別結果和專用聲音識別服務器的聲音識別結果進行綜合從而最終錯誤較少的聲音識別功能。

用于解決課題的手段

在本發明中，預先獲得包含在用戶所持有的終端裝置中的特定單詞的列表，以這些單詞的數據為基礎來構建專用的聲音識別服務器。此外，使用這些數據來事前評價通用聲音識別服務器的性能。以該評價結果為基礎，以數據庫的形式保持在從專用以及通用的聲音識別服務器得到的識別結果之中采用哪個、對它們進行怎樣的加權才能得到最佳的識別結果。在用戶實際使用聲音識別功能時，在由專用以及通用的聲音識別服務器識別輸入聲音后，將由此得到的結果與先前所述的數據庫的內容進行比較，由此得到最佳的聲音識別結果。此外，通過作為事前評價的基準，除了使用聲音識別的正確度以外還使用響應速度，能盡可能早地得到盡可能正確的聲音識別結果。

若舉出本發明的聲音識別服務器綜合裝置的一例，則有對用于用戶使用聲音來進行操作的終端裝置、與識別聲音數據并返回其結果的聲音識別服務器之間進行中繼的裝置，其具備：基于用戶所登記的語句或用戶經常使用的語句的列表來學習并保存識別結果綜合用參數的綜合方式學習部；從所述終端裝置接收用戶為了聲音識別而刻意發出的聲音的數據的單元；將所述接收到的聲音數據發送給通用聲音識別服務器以及專用聲音識別服務器的單元；接收所述通用聲音識別服務器以及專用聲音識別服務器對所述聲音數據進行識別的識別結果的單元；將所述通用聲音識別服務器以及專用聲音識別服務器進行識別的識別結果與所述保存的識別結果綜合用參數進行比較來選擇最佳的識別結果的識別結果綜合部；和將所述選擇的識別結果發送給所述終端裝置的單元。

在本發明的聲音識別服務器綜合裝置中，可以還具備：從所述終端裝置接收用戶所登記的語句或用戶經常使用的語句的列表的單元；以所述接收到的語句為基礎來生成合成聲音的聲音合成部；將所述生成的合成聲音發送給所述通用聲音識別服務器以及專用聲音識別服務器的單元；和接收所述通用聲音識別服務器以及專用聲音識別服務器對所述合成聲音進行識別的識別結果的單元，所述綜合方式學習部將成為所述合成聲音的基礎的語句和所述識別結果一起進行解析，學習并保存識別結果綜合用參數。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于歌樂株式會社，未經歌樂株式會社許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201380018950.0/2.html，轉載請聲明來源鉆瓜專利網。