[發明專利]口語識別系統以及用于訓練和操作該系統的方法有效
| 申請號: | 200580039161.0 | 申請日: | 2005-09-19 |
| 公開(公告)號: | CN101076851A | 公開(公告)日: | 2007-11-21 |
| 發明(設計)人: | 李海州;馬斌;G·M·懷特 | 申請(專利權)人: | 新加坡科技研究局 |
| 主分類號: | G10L15/08 | 分類號: | G10L15/08;G10L15/02 |
| 代理公司: | 北京市中咨律師事務所 | 代理人: | 楊曉光;李崢 |
| 地址: | 新加坡*** | 國省代碼: | 新加坡;SG |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 口語 識別 系統 以及 用于 訓練 操作 方法 | ||
相關申請的交叉引用
此申請對在2004年9月17日提交的美國臨時申請60/611,022主張優 先權,并將其全部內容在此引用作為參考。
技術領域
本發明涉及語言識別系統以及用于訓練和操作所述系統的方法。
背景技術
隨著全球化、國際商務以及安全考慮的增長,對多語言語音應用,具 體地,對自動語言識別(LID)的需求越來越強烈。自動語言識別的可能 應用包括自動呼叫路由、音頻挖掘以及語音自動維護系統(voice?automated attendant?system)。
基于聲學音位結構學的LID表示一種在本領域中使用的語言識別系 統,如圖1中對其進行闡述。所述系統通常包括四個可操作階段,以處理 語音片段并將其分類到多個可能的候選語言中的一個。初始地訓練所述系 統,借此對所述系統進行編程,以識別各候選語言的具體特征。在訓練之 后,進行語言識別操作,借此處理未知語言的語音樣本,并將其與先前編 程的特征進行比較,以確定存在或不存在所述特征,與所述樣本具有最大 數量的相關的候選語言被認為是所述樣本的語言。
常規系統存在幾個缺點,一個缺點是,需要針對具體語言的開發工作 以加入新的候選語言。這種要求引起了聲學和語言建模的高成本,并且需 要語音數據抄錄工作。于是,關于加入新語言,常規系統并不具有很好的 可擴展性。
因此,需要改進的口語識別系統,其對于新的候選語言具有更好的可 擴展性。
發明內容
本發明提供了一種僅利用候選語言的聲音字母表的子集來識別口語 的系統和方法。因為僅使用了所述候選的聲音字母表的子集,語音訓練和 識別操作更快、存儲效率更高。
在一個代表性實施例中,提出了一種訓練口語識別系統以將未知語言 識別為多個已知的候選語言中的一個的方法,所述方法包括如下處理:生 成包括多個聲音標記(sound?token)的聲音目錄,其中從所述已知的候選 語言的子集提供所述集體的(collective)多個聲音標記。所述方法進一步 包括提供多個訓練樣本,每個訓練樣本由一個已知的候選語言構成。進一 步包括從各個訓練樣本生成一個或多個訓練向量的處理,其中,每個訓練 向量被定義為從所述已知候選語言的子集提供的所述多個聲音標記的函 數。所述方法進一步包括將各訓練向量與相對應的訓練樣本的候選語言相 關聯。
參考如下附圖和示例性實施例的詳細描述,將更好地理解本發明的這 些和其它特征。
附圖說明
圖1闡明了本領域中已知的口語識別系統;
圖2闡明了根據本發明的口語識別系統;
圖3闡明了一種根據本發明的用于訓練口語識別系統的方法;
圖4闡明了一種根據本發明的識別未知語言樣本的語言的方法;
圖5A闡明了根據本發明提供的口語識別系統的分類出錯率 (classification?error?rate);
圖5B闡明了與現有技術的聲學音位結構學系統相比的本發明的口語 識別系統的分類出錯率;
圖6闡明了作為用于本發明的口語識別系統的訓練數據的函數的示例 性分類出錯率。
為簡明起見,在后續附圖中保留在前識別的特征的參考數字。
具體實施方式
語言識別系統
圖2闡明了根據本發明的口語識別系統。所述系統200包括聲音識別 器210和聲音分類器220。任選地,所述系統200可包括數據庫230,用于 存儲訓練樣本2321-n,以及數據庫240,用于存儲訓練向量2421-n??蛇x地, 數據庫230和240可以遠離所述系統200。
所述聲音識別器200包括被連接以接收訓練樣本2301-n的輸入,聲音 識別器200還可進行操作,以接收(經由相同的輸入或另一個輸入)未知 語言樣本250。讀者將知道,可以以幾種不同形式提供所述訓練和/或未知 語言樣本,例如,作為實況或記錄的聲音,所述語音本身可為任何格式, 如,模擬或數字形式。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于新加坡科技研究局,未經新加坡科技研究局許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200580039161.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種匯款電子自助系統
- 下一篇:一種從提金尾渣中浮選硫精礦的方法





