[發明專利]歧義消除語言模型無效
| 申請號: | 02106530.6 | 申請日: | 2002-01-29 |
| 公開(公告)號: | CN1369830A | 公開(公告)日: | 2002-09-18 |
| 發明(設計)人: | 朱云正;F·A·阿列瓦 | 申請(專利權)人: | 微軟公司 |
| 主分類號: | G06F17/22 | 分類號: | G06F17/22 |
| 代理公司: | 上海專利商標事務所 | 代理人: | 錢慰民 |
| 地址: | 美國華*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 歧義 消除 語言 模型 | ||
發明背景
本發明涉及語言建模。更特別地,本發明涉及創建及使用一種用于使諸如輸入語音的字符識別期間的歧義最小化的語言模型。
準確的語音識別不只需要一種聲學模型來選擇用戶所說的正確的單詞。換句話說,如果一個語音識別器必須選擇或確定所發音的是哪一個單詞,如果所有的單詞都具有相同的發音,則該語音識別器將顯然不能滿意地執行。一種語言模型提供了一種指定詞匯表中哪一個單詞序列是可能的的方法或裝置,或者通常,提供了有關各種單詞序列相似性的信息。
語音識別經常被看作是一種自上至下的語言處理形式。語言處理的兩種一般形式包括“自上至下”和“自下至上”。自上至下語言處理是以語言的最大單元開始來識別,例如一個句子,通過將其分類為比較小的單元來處理,例如詞組,依次再分為更小的單元,例如單詞。相反,自下至上語言處理是以單詞開始,并從那里開始構造較大的詞組和/或句子。語言處理的這兩種形式都可以從語言模型中得到幫助。
一種公知的分類技術是使用一種N個字符列語言模型。因為N個字符列可以結交大量的數據,N個單詞的相關性通常提供句法和語義的壓制的淺部結構。盡管N個字符列語言模型對于一般的口授可以執行的很好,但是同音異義字會產生很大的錯誤。一個同音異義字是諸如字符或音節這樣的語言代碼的一個元素,也就是發音類似但具有不同拼寫的兩個或多個元素之一。例如,當一個用戶正拼寫字符時,由于一些字符發音相同語音識別模塊會輸出錯誤的字符。同樣的,對于當發音的時候聽起來互相類似的不同字符語音識別模塊也會輸出錯誤的字符(例如“m”和“n”)。
歧義問題在如日語或漢語等語言中尤其普遍,其主要是以漢字寫入系統來書寫。這些語言的字符是很多復雜的表示聲音和意思的象形文字。這些字符形成了有限的音節,依次產生大量同音異義字,大大增加了通過口授生成文件所需的時間。特別是,在文件中必須識別錯誤的同音異義字字符并插入正確的同音異義字字符。
因此有一種持續的需求去開發新的方法,用于使在發同音異義字和具有不同意思的相似發音的語音時的歧義最小化。隨著技術的發展,在更多的應用中都提供有語音識別,這就必須要得到一種更準確的語言模型。
發明概述
語音識別器通常使用一種如N個字符列語言模型的語言模型來提高準確性。本發明的第一個方面包括生成一種語言模型,其在一個講話者正識別一個字符或多個字符(例如一個音節)例如當拼寫一個單詞時特別有用。該語言模型有助于同音異義字和聽起來互相類似的不同字符的歧義消除。該語言模型由包含一個字符串(可以是單個字符)的相關元素、一個具有字符串的單詞詞組(可以是單個單詞)和一個上下文標記的訓練語料庫構造。使用一個單詞表或字典,通過為每一個包含單詞詞組、上下文標記和單詞詞組的一個字符串的單詞詞組形成一個局部的句子或詞組可以自動生成訓練語料庫。在另一個實施例中,為單詞詞組的每一個單詞符生成一個詞組。
本發明的另一個方面是一種使用上述用于識別所說的字符的語言模型的系統或模塊。當說一個字符串時結合相關的單詞詞組中的上下文標記,語音識別模塊確定用戶正在拼寫或識別字符的方式。該語音識別模塊將只輸出被識別的字符,而不輸出上下文標記或相關的單詞詞組。在又一個實施例中,語音識別模塊比較被識別的字符和一個被識別的單詞詞組以驗證已被識別的正確的字符。如果被識別的字符不在被識別的單詞詞組中,則輸出的字符是被識別單詞詞組的一個字符。
附圖的簡要說明
附圖1是一個語言處理系統的方框圖。
附圖2是一個典型的計算環境的方框圖。
附圖3是一個典型的語音識別系統的方框圖。
附圖4是本發明的一種方法的流程圖。
附圖5是用于實現附圖4的方法的模塊框圖。
附圖6是一種語音識別模塊和一種可選的字符驗證模塊的方框圖。
說明性實施例的詳細描述
附圖1示出了一種語言處理系統10,其接收一個語言輸入12,并處理該語言輸入12以提供一個語言輸出14。例如,該語言處理系統10可以被具體化為一種接收由用戶所說或所記錄的語言的語言輸入12的語音識別系統或模塊。語言處理系統10處理所說的語言并提供以文字輸出形式的識別單詞和/或字符作為一個輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟公司,未經微軟公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/02106530.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電話的改進
- 下一篇:具有張力蔭罩減振器的陰極射線管





