[發明專利]歧義消除語言模型無效
| 申請號: | 02106530.6 | 申請日: | 2002-01-29 |
| 公開(公告)號: | CN1369830A | 公開(公告)日: | 2002-09-18 |
| 發明(設計)人: | 朱云正;F·A·阿列瓦 | 申請(專利權)人: | 微軟公司 |
| 主分類號: | G06F17/22 | 分類號: | G06F17/22 |
| 代理公司: | 上海專利商標事務所 | 代理人: | 錢慰民 |
| 地址: | 美國華*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 歧義 消除 語言 模型 | ||
1.一種創建用于語音識別系統的語言模型以指示字符的方法,該方法包括:
對于單詞詞組表中的每一個單詞詞組,將該單詞詞組的字符串和該單詞詞組與表示識別該字符串的上下文標記相關聯;
構造一個語言模型作為相關單詞詞組和字符串的一個功能。
2.權利要求1的方法,其中該語言模型包括一個統計語言模型。
3.權利要求2的方法,其中該語言模型包括一個N字符列語言模型。
4.權利要求2的方法,其中該語言模型包括一個上下文無關文法。
5.權利要求1的方法,其中關聯包括構造一個相關字符串、單詞詞組和上下文標記的語料庫,并且其中構造語言模型包括訪問該語料庫。
6.權利要求1的方法,其中關聯包括將每一個單詞詞組的第一個字符與該單詞詞組相關聯。
7.權利要求6的方法,其中關聯包括將至少一部分單詞詞組的另一個字符,而不是第一個字符,與對應的單詞詞組相關聯。
8.權利要求7的方法,其中關聯包括至少一部分單詞詞組的每一個字符與對應的單詞詞組相關聯。
9.權利要求7的方法,其中關聯包括將每一個單詞詞組的每一個字符與對應的單詞詞組相關聯。
10.權利要求1的方法,還包括為語言模型中的每一個相關字符串和單詞詞組校正概率得分。
11.權利要求1的方法,其中關聯包括為單詞詞組表的每一個單詞詞組形成一個包含單詞詞組字符串、單詞詞組和上下文標記的詞組。
12.權利要求11的方法,其中上下文標記類似于英語中的“as?in”。
13.權利要求11的方法,其中上下文標記包括漢語中的的。
14.權利要求11的方法,其中上下文標記包括日語中的の。
15.權利要求1的方法,其中每一個單詞詞組都是一個單個單詞。
16.權利要求15的方法,其中每一個字符串都是一個單個字符。
17.權利要求1的方法,其中每一個字符串都是一個單個字符。
18.一種具有指令的計算機可讀介質,當由一個處理器執行時,該計算機可讀介質執行用于識別所說字符的方法,該方法包括:
接收具有字符串、帶字符串的單詞詞組和上下文標記的輸入語音;
以文本輸出該字符串,而沒有單詞詞組和上下文標記。
19.權利要求18的計算機可讀介質,還包括用于訪問表示多個詞組的語言模型的指令,每一個詞組具有一個字符串、帶字符串的單詞詞組和上下文標記。
20.權利要求19的計算機可讀介質,其中該語言模型表示實質上由相關字符串、具有字符串的單詞詞組和上下文標記構成的詞組。
21.權利要求19的計算機可讀介質,其中輸出字符串包括利用語言模型以識別字符串的功能的輸出字符串。
22.權利要求21的計算機可讀介質,其中語言模型包括一個統計語言模型。
23.權利要求22的計算機可讀介質,其中語言模型包括一個N字符列語言模型。
24.權利要求21的計算機可讀介質,其中輸出字符串包括用作所接收的輸入語音的N字符列的唯一功能的輸出字符串。
25.權利要求21的計算機可讀介質,其中輸出字符串包括用作將識別的字符串和識別的單詞詞組相比較功能的輸出字符串。
26.權利要求25的計算機可讀介質,其中當識別的字符串沒有存在于識別的單詞詞組中時,被輸出的字符串是識別的單詞詞組的一個字符串。
27.權利要求21的計算機可讀介持,其中語言模型包括一個上下文無關文法。
28.權利要求18的計算機可讀介質,其中每一個單詞詞組都是一個單個單詞。
29.權利要求28的計算機可讀介質,其中每一個字符串都是一個單個字符。
30.權利要求18的計算機可讀介質,其中每一個字符串都是一個單個字符。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟公司,未經微軟公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/02106530.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電話的改進
- 下一篇:具有張力蔭罩減振器的陰極射線管





