[發明專利]不同語言的現有語音識別方案的快速原形化的系統和方法有效
| 申請號: | 201010182828.5 | 申請日: | 2010-05-19 |
| 公開(公告)號: | CN101901599A | 公開(公告)日: | 2010-12-01 |
| 發明(設計)人: | S·K·科帕拉普;I·A·謝赫;A·S·法蘭德 | 申請(專利權)人: | 塔塔咨詢服務有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G06F17/28;G06F17/30 |
| 代理公司: | 北京市中咨律師事務所 11247 | 代理人: | 楊曉光;于靜 |
| 地址: | 印度*** | 國省代碼: | 印度;IN |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 不同 語言 現有 語音 識別 方案 快速 原形 系統 方法 | ||
技術領域
本發明涉及語音識別領域。
背景技術
說明書中使用的術語的定義
以下是本領域已知的并在說明書中使用的術語的定義:
●字素(grapheme):是書面語言的基本單位。
●音素(phoneme):是聲音的最小部分單位,其用以形成話語之間的有意義的對比。
●翻譯(translate):是文本的意義的理解以及用另一語言傳達相同消息的同等文本的后期制作。
●音譯(transliterate):是以系統化方式將文本從一個書寫系統轉換成另一書寫系統的處理。
如今,為了提高客戶服務,交互技術扮演了關鍵角色。如IVR(交互式語音應答)交互技術接受口頭的用戶輸入和/或請求,并響應于用戶的請求提供預記錄的或動態生成的輸出。
典型地,IVR應用使用語音識別系統識別并將口語單詞或口語單詞序列轉換成機器可讀形式,用于進一步處理和/或應答用戶查詢。典型地,這些語音識別系統被部署用于特定語言,因此當必須部署相同系統用于不同語言時,必須移植(port)現有系統,使其能夠理解新語言,這等同于建立新的應用。由于以下原因,大部分現有系統以英語來部署:
(a)語言的更廣泛的可接受性;以及
(b)英語的信息和其他資源的隨時性。
然而,隨著在本國語言并非英語的各個國家中基于語音的方案的可接受性增加,急切地需要將源語言(例如英語)的基于現有語音識別的應用轉換成目標語言(例如印地語)。
典型地,基于現有語音識別的方案需要以下組件:
●具有用于聲學識別的聲學模型的語音識別(SR)引擎;
●必須識別的單詞的發音詞典;
●語音文法或語言模型;以及
●用于產生來自用戶的響應的語音提示,即,提示用戶提交他們的查詢。
前三個組件在一起協作將口語語音轉換成文本,而第四個組件幫助基于現有語音識別的方案與用戶交流。典型地,從源語言將基于現有語音識別的方案轉換成目標語言需要將這四個組件移植到目標語言。
但是,如果以目標語言適當地實現了其他兩個組件(即發音詞典和語音文法),則為了特定語言調整聲學模型,并使用聲學模型以滿意的精度識別另一語言的語音。
實質上,從一個語言將基于現有語音識別的方案轉換成另一語言必須創建用于目標語言的新的發音詞典,其包含基于語音識別的方案要識別的所有單詞以及目標語言的語音文法模型。此外,必須將源語言的提示轉換成目標語言的提示。
用于將源語言的基于現有語音識別的方案移植成目標語言的這些修改需要等同于建立完全新的基于語音識別的方案的工作量。在現有技術中存在各種嘗試,以開發能夠容易地將應用從一個語言移植成另一語言的系統。
具體地,美國專利7406417公開了一種調節用于自動語音處理的數據庫的方法。該文檔公開了一種神經網絡,其可被訓練以借助于通過自動匹配字素和音素所生成的數據庫來合成或識別語音。首先,對于具有相同數目的字素和音素的單詞來匹配字素和音素。接下來,在將字素與先前音素組合的一系列步驟中,對于具有比音素更多字素的單詞來匹配字素和音素。然后,對于具有比音素更少字素的單詞來匹配字素和音素。在每個步驟之后,清除在先前步驟中做出的較少的和未成功的匹配。在這個處理完成之后,可使用數據庫來訓練神經網絡和字素,或者可借助于訓練的人工神經網絡將文本的字母轉換成相應的音素。
此外,美國專利申請2005197835公開了一種方法和裝置,用于生成由非本國演講者發出的外語單詞的演講者獨立語音識別的聲學模型。該文檔公開了自動生成的并利用來自本國語言和外國語言的訓練聲學模型的用于語音識別的聲學模型。利用音素到音素的映射來實現通過本國語言音素對外國語言單詞的描述。使用音素到音素的映射來訓練外國語言單詞,這通過本國語言音素以外國語言語音素材來描述。
創建新的音素詞典,其包含外國語言單詞以及由本國語言音素轉錄的本國語言單詞。可利用外國語言和本國語言訓練素材導出健壯的本國語言聲學模型??墒褂盟鲇成鋪碛柧氉炙氐揭羲剞D換器(即外國語言到本國語言),以生成對于新的外國語言單詞的本國語言發音。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于塔塔咨詢服務有限公司,未經塔塔咨詢服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010182828.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:防盜型扶手燈
- 下一篇:一種帶藍牙音響的水晶球燈





