[發明專利]多語言非母語語音識別有效
| 申請號: | 200810086920.4 | 申請日: | 2008-03-28 |
| 公開(公告)號: | CN101276585A | 公開(公告)日: | 2008-10-01 |
| 發明(設計)人: | G·維爾申;M·亨內克;M·施瓦茨;D·威利特 | 申請(專利權)人: | 哈曼貝克自動系統股份有限公司 |
| 主分類號: | G10L15/08 | 分類號: | G10L15/08;G10L15/26;G01C21/26;G01C21/36 |
| 代理公司: | 北京紀凱知識產權代理有限公司 | 代理人: | 沙捷;丁藝 |
| 地址: | 德國卡*** | 國省代碼: | 德國;DE |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語言 母語 語音 識別 | ||
技術領域
本發明涉及一種用于經由語音輸入從元素列表選擇列表元素的方法及其系統。
背景技術
很多電子應用具有由用戶的語音支配或語音控制的設計過程或順序。這些電子應用包括用于交通工具的目的引導系統、電話和/或地址系統等。交通工具包括汽車、火車、輪船、飛機等。
在這些過程或順序中,用戶向語音識別單元提供語音輸入。該語音輸入能夠對應于用戶希望從列表元素的列表或組中選擇的列表元素。語音識別單元處理語音輸入,并響應于處理的語音輸入,選擇所需的列表元素。
WO?2004/077405公開了一種對用戶的語音輸入實施兩步識別過程的語音識別系統。一個識別過程將整個詞的語音輸入分離成至少一個語音子單元序列以產生列表元素的詞匯表。接下來的識別過程將整個詞的語音輸入與列表元素的詞匯表進行比較。
本方法需要列表元素和識別系統的語言相同。舉例來說,在導航應用中,當使用德語導航系統的用戶在法國駕駛時可能在目的地點的語音驅動選擇中存在困難。
發明內容
因此,存在這樣的一種需要:為來自不同于語音識別系統訓練的語言的另一自然語言的列表元素的語音驅動選擇提供可能。
本發明通過提供獨立的權利要求中提及的方法和語音識別系統來克服這種需要。在相關權利要求中描述了本發明的優選實施例。
根據本發明的第一方面,提供一種用于經由語音輸入從元素列表選擇列表元素的方法。該方法包括為語音輸入識別子詞單元(subwordunit)串的步驟。在另一步驟中,識別的子詞單元串與元素列表相比較,且基于比較結果產生最佳匹配元素的候選列表。為產生最佳匹配元素的候選列表,使用包含矩陣元素的混淆矩陣(confusion?matrix),所述矩陣元素包括關于不同語言的子詞單元的混淆概率的信息。在常規系統中,在語音識別系統中使用的混淆矩陣比較相同語言的子詞單元?,F在,本發明的一個方面是要建立和使用能夠比較不同語言的混淆矩陣?;煜仃囃ㄟ^用于每個子詞單元的識別系統為給定的子詞單元組定義可能被錯誤識別的子詞單元組。子詞單元可以對應于語言的音素或音節或任意其他單元,諸如較大組音素或較小組音素(諸如半音素(demiphoneme))。當子詞單元是音素時,音素序列被確定為最好地匹配所述語音輸入的子詞單元串。
優選地,混淆矩陣的每個矩陣元素代表特定子詞單元對的混淆概率,所述子詞單元對包含第一語言的子詞單元和不同于第一語言的第二語言的子詞單元。矩陣的每個元素代表特定子詞單元對的混淆概率。每個矩陣元素數字地指定了子詞單元對的第一子詞單元與子詞單元對的另一子詞單元的混淆程度。優選地,混淆矩陣包含第一語言的可能子詞單元以及第一語言的這些可能子詞單元與第二語言的可能子詞單元的混淆概率。因為兩種語言的子詞單元典型地在子詞單元或音素的數量上不同,混淆矩陣不再是正方的。只包括一種語言的子詞單元的混淆矩陣是正方的,因為矩陣具有相同的列數和行數。
根據本發明的另一方面,使用被訓練成識別第一語言的子詞單元的子詞單元語言識別單元來識別子詞單元串,以識別與第一語言不同的語言的語音輸入。該方面的思想是使用相同的識別器訓練用于識別的混淆矩陣,但是針對外語。舉例來說,被訓練成理解德語語音輸入的子詞單元語音識別單元用于識別諸如法語或英語的另一語言中的子詞單元序列,以評估混淆矩陣的混淆概率。該方法的優點在于它隱含地得知了這兩種不同語言之間的最典型的子詞單元混淆。
根據本發明的一個方面,不同的混淆矩陣可以設置有用于不同語言對的混淆概率。在本實施方案中,若干混淆矩陣將可用于不同的語言對。這允許匹配不同的語言。當可以使用不同的語言對和不同的混淆矩陣時,必須選擇用于產生最佳匹配元素的候選列表的混淆矩陣。
為此,優選地通過確定用戶的語言和通過確定元素列表的語言確定語音輸入的語言對,并相應地選擇混淆矩陣。在大多數語音識別應用中,語音識別系統的用戶語言是已知的。如果可以確定元素列表的語言,則語言對是已知的。
當元素列表是用于引導用戶到列表的目的地點之一的導航系統中使用的目的地點列表時,可以以下面的方式確定語言對的語言之一。首先,例如,通過確定交通工具的當前位置并通過將它與地圖數據相比較,確定導航系統用在哪個國家。當交通工具的位置已知時,可以推斷出交通工具所行駛的國家。當國家已知時,能夠確定該國家的官方語言。舉例來說,當交通工具在德國行駛時,能夠推斷出目的地點的列表包括德語名稱,當交通工具在法國行駛時,所述列表可以包括諸如城市或其他目的地點的名稱的法語列表元素。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈曼貝克自動系統股份有限公司,未經哈曼貝克自動系統股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810086920.4/2.html,轉載請聲明來源鉆瓜專利網。





