[發明專利]與揚聲器無關的語音識別裝置無效
| 申請號: | 02105569.6 | 申請日: | 2002-04-17 |
| 公開(公告)號: | CN1381831A | 公開(公告)日: | 2002-11-27 |
| 發明(設計)人: | O·維基;K·勞里拉 | 申請(專利權)人: | 諾基亞有限公司 |
| 主分類號: | G10L15/00 | 分類號: | G10L15/00;G10L15/14 |
| 代理公司: | 中國專利代理(香港)有限公司 | 代理人: | 欒本生,李亞非 |
| 地址: | 芬蘭*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 揚聲器 無關 語音 識別 裝置 | ||
技術領域
本發明涉及在遠程通信系統中與揚聲器無關的語音識別,尤其是涉及用于語音識別的發音模型化。
技術背景
近年來已經開發了不同的語音識別應用,例如,用于汽車的用戶接口和移動站等。用于移動站的已知方法包括通過對移動站的話筒大聲地說出他的/她的名字并建立對依據用戶所說的名字號碼的呼叫來呼叫一個特定人的方法。然而,為了識別每個名字的發音,本方法通常需要對網絡中的移動站或系統進行培訓。與揚聲器無關的語音識別改進了語音控制的用戶接口的可用性,因為可以省略這個培訓階段。在揚聲器無關的名字選擇中,可以對聯系信息中的名字的發音模型化,可以將由用戶說出的名字與所規定的發音模型,如一種音素序列,作比較。
多種與揚聲器無關的語音識別方法是已知的,由此可以實現發音的模型化。例如,為此目的可以使用音素詞匯。基于音素詞匯的一種方法公開在WO?9?926?232中。然而,音素詞匯的規模是如此之大,以致目前移動站的存儲器容量是不夠的。其它的問題是由在詞匯中未找到的名字和字引起的。不同的統計方法,如神經網絡和判定樹,使較少的存儲器花費成為可能。雖然利用判定樹比利用需要較少存儲器空間的神經網絡可以達到更精確的結果,但兩種方法都是有丟失的。這樣就降低了模型的精度,也就使語音識別精度的性能下降。因此,關于精度和存儲器的花費必須要作折衷。盡管有高的壓縮度,判定樹和神經網絡的存儲器要求仍然是相當高的。典型情況下,一種基于判定樹的模型系統對每種模型化的語言需要大約100至250KB的存儲器,當實施移動站時,這可能是太多了。另一種可選方案是發送由用戶的語音組成的聲頻信號到一個網絡,并在網絡中實現語音識別。在網絡中實現語音識別需要對一種服務建立連接,這將引起過分的延時,并且無線電路徑上的干擾降低后繼工作的前景。
發明概述
因此,本發明的一個目的是提供一種方法和實現該方法的設備,使得精確的發音模型化成為可能并減輕以上的問題。本發明的目的是利用其特征被描述在獨立的權利要求中的方法,遠程通信系統,電子設備,服務器,計算機程序產品和數據媒體實現的。本發明的優選實施方案被公開在從屬的權利要求中。
本發明是基于這樣的構思,即用于便攜式電子設備的發音模型化是在一種分離的服務器設備中實現的。因此,要將用于語音識別的字符序列從一個電子設備發送到一個比電子設備擁有更多的可用的存儲器容量的服務器。字符序列在服務器中被變換成至少一種聲音單元序列。將該聲音單元序列從該服務器發送到該電子設備以便在語音識別中使用。任何包括遠程通信裝置的數據處理設備可起著該服務器的作用,將該數據處理設備安排成實施對從一個或多個電子設備接收到的字符序列變換成一種聲音單元序列。字符序列是指字符的任何組合。典型情況下,它是一種字母序列,但也可以是標點符號(例如逗號或空格字符)。字符序列也可以由多數在亞洲人的語言中使用的象形字符組成。聲音單元包括任何聲音事件,例如20ms語音樣本,音節,音素或音素的部分。典型情況下,實現語音識別的設備將音素分成三部分(開始,中間,結束),可以據此實施與語音信息的比較。應該指出,一個音素也可以是指一個音素群(在不同的語言中發音形式可以相互非常接近)。
因為服務器本來就比該電子設備擁有更多的可用的存儲器容量,在依據本發明的解決方案中,對發音模型化精度的折衷是不需要的。因為沒有存儲器約束,也可以支持比在電子設備中實施的模型化更多的語言。
依據本發明的優選實施方案,將從電子設備接收到的字符序列用作搜索與所述的序列有關的信息(例如電話號碼)的基礎。除了聲音單元序列以外,將該信息發送到電子設備。這對用戶是有利的,因為可以容易地提供與字符序列有關的附加信息用于電子設備中。
依據本發明的另一種優選實施方案,在一種聲音合成器中用聲音單元序列組成一個聲音模型。將該聲音模型存儲在電子設備中,將它與字符序列或它的標記相聯系。至少作為對基本上對應于從字符序列接收到的聲音單元序列的用戶語音命令的一種響應,對電子設備的用戶重復該聲音模型。這樣就改進了可用性,因為用戶也接收與字符序列有關的聲音反饋。
附圖簡述
現在將參考附圖,結合優選實施方案更詳細地描述本發明,其中:
圖1a示出一種可以應用本發明的遠程通信系統方框圖;
圖1b示出一種電子設備和服務器的方框圖;
圖2示出一種依據本發明的第一優選實施方案的方法的流程圖;
圖3示出一種依據本發明的第二優選實施方案的方法的流程圖;和
圖4示出一種依據本發明的實施方案的流程圖,在其中組成一個聲音模型。
發明詳述
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于諾基亞有限公司,未經諾基亞有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/02105569.6/2.html,轉載請聲明來源鉆瓜專利網。





