[發明專利]口語識別系統以及用于訓練和操作該系統的方法有效
| 申請號: | 200580039161.0 | 申請日: | 2005-09-19 |
| 公開(公告)號: | CN101076851A | 公開(公告)日: | 2007-11-21 |
| 發明(設計)人: | 李海州;馬斌;G·M·懷特 | 申請(專利權)人: | 新加坡科技研究局 |
| 主分類號: | G10L15/08 | 分類號: | G10L15/08;G10L15/02 |
| 代理公司: | 北京市中咨律師事務所 | 代理人: | 楊曉光;李崢 |
| 地址: | 新加坡*** | 國省代碼: | 新加坡;SG |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 口語 識別 系統 以及 用于 訓練 操作 方法 | ||
1.一種操作口語識別系統的方法,將未知語言識別為多種已知的候 選語言中的一種,所述方法包括如下步驟:
生成包括多個聲音標記的聲音目錄,從所述已知的候選語言的子集提 供集體的多個聲音標記;
提供多個訓練樣本,每個所述訓練樣本由一種所述已知的候選語言構 成;
從各個所述訓練樣本生成一個或多個訓練向量,其中,每個所述訓練 向量被定義為從所述已知候選語言的子集提供的所述多個聲音標記的函 數;以及
將各個所述訓練向量與相對應的所述訓練樣本的候選語言相關聯;
從未知語言樣本生成未知語言向量,所述未知語言向量被定義為從所 述已知候選語言的子集提供的所述多個聲音標記的函數;以及 將所述未知語言向量與多個所述訓練向量相關;
其中,將與所述未知語言向量最相關的訓練向量所相關聯的語言識別 為所述未知語言樣本的語言;
其中,生成一個或多個訓練向量包括生成對應于一種候選語言的多個 訓練向量,所述方法進一步包括:從與所述候選語言相關聯的所述多個訓 練向量構造統計模型;
其中使用所述多個訓練向量的算術平均值來形成均值訓練向量,所述 均值訓練向量形成統計模型λn的基礎,該統計模型被用于確定在所述均值 訓練向量和與未知語言樣本相關聯的未知語言向量之間的相關性。
2.根據權利要求1所述的方法,其中,所述聲音目錄包括V個所述 聲音標記,所述訓練向量包括在聲音標記序列中的聲音標記 的計數,其中n是候選語言指數,L是該聲音標記序列的長度,其中,所 述聲音標記的計數包括其中v被定義為所述聲音目錄中的第v個聲音 標記,且被定義為所述聲音標記序列中的所述第v個聲音 標記的出現次數除以所有聲音標記的總出現次數:
3.根據權利要求1所述的方法,其中,所述聲音目錄包括V個聲音 標記,所述訓練向量包括在聲音標記序列中的聲音標記對的 計數,其中n是候選語言指數,L是該聲音標記序列的長度,其中,所述 聲音標記對的計數包括其中,被定義為在所述聲音標記序列 中的聲音標記對的出現次數除以所有聲音標記對{vjvk}的總 出現次數:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于新加坡科技研究局,未經新加坡科技研究局許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200580039161.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種匯款電子自助系統
- 下一篇:一種從提金尾渣中浮選硫精礦的方法





