[發明專利]有效地實施語音識別字典的系統和方法無效
| 申請號: | 201010260773.5 | 申請日: | 2004-03-31 |
| 公開(公告)號: | CN101958118A | 公開(公告)日: | 2011-01-26 |
| 發明(設計)人: | X·梅嫩德斯-皮達爾;呂靜雯;L·奧羅倫肖;段鐳 | 申請(專利權)人: | 索尼電子有限公司 |
| 主分類號: | G10L15/14 | 分類號: | G10L15/14 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 李舒;劉鵬 |
| 地址: | 美國新*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 有效地 實施 語音 識別 字典 系統 方法 | ||
本申請是申請日為2004年3月31日、申請號為200410033229.1、發明名稱為“有效地實施普通話漢語語音識別字典的系統和方法”的發明專利申請的分案申請。
技術領域
一般地說本發明涉及電子語音識別系統,更具體地說涉及有效地實施普通話漢語(Mandarin?Chinese)語音識別字典的系統和方法。
背景技術描述
實施系統用戶與電子設備進行穩健且有效的人機通信是系統設計者和制造商們非常重視的考慮因素。電子設備的語音控制操作是用于多種系統用戶的理想接口。例如,語音控制操作允許用戶同時執行其它的任務。例如,一個人在駕駛機車的同時,通過語音控制可以操作電子管理器。對于那些具有身體障礙或其它特殊要求的用戶來說電子系統的免提操作是比較理想的。
電子設備的免提操作可以通過各種語音啟動的電子系統實現。語音啟動的電子系統由此有利地允許用戶在其使用常規的輸入設備不方便或者可能有危險的情況下與電子設備進行人機通信。電子娛樂系統也可以利用語音識別技術來允許用戶通過向某一系統說話而與其交互。
然而,有效地實施這種系統對系統設計者來說可是一種巨大的挑戰。例如,增加系統的功能和性能的進一步需求可能要求更大的系統處理能力和要求其它的硬件資源。由于增加了生產成本和操作的無效率,在處理或硬件要求方面的增加也相應地導致了不利的影響。
此外,增強系統執行各種高級操作的系統能力雖然可以給系統用戶提供其它的優點,但也導致了對各種系統部件的控制和管理的增加。例如,有效地識別在普通話漢語語言中的字和詞的增強的電子系統得益于有效的實施方案,因為要求大量且復雜的數字數據。因此,對于所有的前述原因,實施系統用戶與電子設備人機通信的穩健且有效的方法一直是系統設計者和制造者重要的考慮因素。
發明內容
根據本發明,公開了一種有效地實施普通話漢語語音識別字典的系統和方法。在一個實施例中,識別器可以被構造成將輸入語音數據與來自根據優化的普通話漢語音素集實施的詞匯詞典的音素串進行比較。
優化的普通話漢語音素集可以以語音學技術實施以單獨包括輔音音素和元音音素。由于系統效率的緣故,優化的普通話漢語音素集優選以小型化的方式實施以僅包括在語音識別過程中精確地表示普通話漢語語音所要求的最小數量的輔音音素和元音音素。
根據本發明的某些實施例,通過利用將多個音位變體(allophone)或發音變化映射到優化的音素集中的相同對應音位的音位變體變化技術(allophone?variation?technique)可以有效地實施優化的普通話漢語音素集。在某些實施例中,音位變體變化技術可以將音位變體映射到包括輔音類別、半元音類別和元音類別的音素集中。
此外,通過利用各種不同的字典優化技術可以實施前述的詞匯字典以提供穩健且精確的語音識別。區域變化(regional?variation)技術可以將輸入語音數據的區域變化映射到在詞匯字典中的統一的對應條目,由此改善語音識別精度。輸入語音數據的每個區域變化根據地理區域的不同具有重要的發音變化。在某些實施例中,發音的區域變化包括北方普通話漢語和南方普通話漢語的普通話漢語發音變化。
此外,在某些實施例中,前述的詞匯字典可以實施為對應于特定的口語語言的不同的具體的區域發音變化的統一的字典。然后在語音識別過程中該字典可以精確地識別北方普通話漢語語音或南方普通話漢語語音。因此本發明提供了一種有效地實施普通話漢語語音識別字典的系統和方法。
附圖說明
附圖1所示為根據本發明的計算機系統的一個實施例的方塊圖;
附圖2所示為根據本發明附圖1的存儲器的一個實施例的方塊圖;
附圖3所示為根據本發明附圖2的語音檢測器的一個實施例的方塊圖;
附圖4所示為根據本發明附圖2的隱馬爾可夫模型(Hidden?Markov?Model)的一個實施例的附圖;
附圖5所示為根據本發明附圖2的字典的一個實施例的附圖;
附圖6所示為根據本發明的一個實施例附圖5的字典條目的附圖;和
附圖7所示為根據本發明的一個實施例說明區域變化技術的附圖。
具體實施方式
本發明涉及語音識別系統的改進。提供下面的描述以便在本領域的普通技術人員能夠實現并使用本發明,并且這些描述根據專利申請及其要求提供。對優選實施例做出各種改進對于本領域普通技術人員來說是顯而易見的,因此在此的一般原理可應用于其它的實施例。因此并不希望將本發明限于所示的實施例,而是應該給予與在此所描述的原理和特征相一致的最寬泛的范圍。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于索尼電子有限公司,未經索尼電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010260773.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:圓筒形鋼套箱圍堰及其施工方法
- 下一篇:顯示系統中的屏幕破損檢測





