[發明專利]用于生成語音譜的方法有效
| 申請號: | 200610135662.5 | 申請日: | 2006-10-20 |
| 公開(公告)號: | CN101165776A | 公開(公告)日: | 2008-04-23 |
| 發明(設計)人: | 曹振海;祖漪清 | 申請(專利權)人: | 摩托羅拉公司 |
| 主分類號: | G10L13/00 | 分類號: | G10L13/00;G10L13/02;G10L13/04;G10L15/08;G10L15/14 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 | 代理人: | 康建忠 |
| 地址: | 美國伊*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 生成 語音 方法 | ||
技術領域
本發明通常涉及一種語音合成。具體來說,但并不是排他的,本發明涉及使用與語音識別系統關聯的、諸如隱馬爾可夫模型(HMM)狀態的模型狀態來提供合成的語音反饋。
背景技術
許多語音識別系統將輸入言語匹配于存儲在數據庫中的聲學模型。其后,匹配的聲學模型與詞典數據庫中的條目關聯,從而完成文字和語句識別。聲學模型通常包括隱馬爾可夫模型(HMM)。HMM是統計描述,包括均值和方差矢量,其描述諸如文字和音素的語音單元。其后,HMM模式匹配用于確定語音識別數據庫中的聲學模型是否匹配于輸入言語。HMM通常是基于包括被稱為高斯混合的一些復高斯概率分布函數(PDF)的概率函數的。因此,HMM模式匹配可包括匹配高斯混合的處理。
通常將語音識別系統分類為與揚聲器無關的或與揚聲器相關的。揚聲器無關系統被設計為識別許多揚聲器的語音;而揚聲器相關系統被訓練為識別一個揚聲器或僅少量揚聲器的語音。揚聲器無關系統通常包括包含從多個訓練揚聲器的語音得到的HMM的聲學數據庫。從訓練揚聲器的語音得到的HMM期望表示在較大的一組揚聲器中發現的語音模式。這樣的系統通常比揚聲器相關系統的精度低,因為必須在語音模型中進行折衷以容納大量語音屬性,并且揚聲器無關系統沒有被調諧到任意特定揚聲器的特有語音屬性上。
揚聲器相關系統被調諧為識別特定語音模式和各個揚聲器的特有語音屬性。通常揚聲器在訓練程序期間將包括各種語音模式的腳本讀入系統。其后,訓練語音與腳本進行調準(align),從而系統可調諧到揚聲器的特有語音屬性,因此,系統將在語音識別期間更精確的識別揚聲器的語音。然而,在許多人可能需要使用特定語音識別系統的情況下,揚聲器相關系統通常是不期望的。例如,揚聲器無關語音識別系統可以是在諸如移動電話的電子設備中是優選的,以使多個用戶能發布口頭命令,從而呼叫特定電話號碼,或指示其后由電話識別的口語消息。
存在用于改進揚聲器無關語音識別系統的性能的各種技術。例如,在線揚聲器適配技術使揚聲器無關聲學模型能夠在用于特定個人的語音特性期間被調諧。在使用期間的在線揚聲器適配可與離線揚聲器適配對照,例如揚聲器相關系統的上述訓練處理,其中,用戶將預先定義的腳本寫入系統,從而在使用之前訓練系統來識別其語音。
然而,在運行在移動電話中的語音識別系統的上述示例中,因為用戶可使用僅用于非常簡短的周期的電話的語音識別特征,例如發布短的口頭命令或指示單個短文本消息,所以在線揚聲器視頻可能是無效的。在這樣的情況下,在線揚聲器適配處理在完成識別任務之前可能沒有時間進行收斂。因此,在線揚聲器適配處理沒有改進移動電話的語音識別系統。此外,諸如交通和人群噪聲的、通常與移動電話關聯的噪聲背景環境可使得在線揚聲器適配處理難以收斂。
用于改善揚聲器無關語音識別系統的另一技術涉及聽覺反饋處理,其中,用戶可聽見由語音識別系統識別的說出的文字或短語的合成的語音回放。因此,用戶能夠立即得知系統是否已經精確地接收并識別語音輸入。這些聽覺反饋處理通常涉及將用于語音識別的隱馬爾可夫模型(HMM)轉換為可在揚聲器上播放的合成語音譜。然而,為了通過使用諸如移動電話的最緊致的電子設備的有限處理和存儲能力來有效地進行工作,聽覺反饋處理需要高效且低復雜性的算法。
發明內容
根據一方面,本發明是一種用于從輸入文字生成語音譜的方法。該方法包括:將與輸入文字關聯的音素的長度與多個模型狀態相調準。其后,通過為所述多個模型狀態中的每一狀態從多混合高斯密度模型狀態中選擇混合來生成狀態序列。接下來,通過使用狀態序列為輸入文字生成語音參數序列。其后,將語音參數序列轉換為語音譜。
因此,本發明的實施例用于通過啟用涉及輸入文字的有效音頻反饋來改進語音識別系統的值和語音識別精度。本發明的實施例例如可結合到各種類型的語音識別系統中,并且在結合有語音識別能力的、諸如揚聲器無關移動電話或個人數字助理(PDA)的手持電子設備中尤其有用。高效算法的使用節約了手持電子設備的有限的電源、存儲器和處理器資源。
附圖說明
為了容易理解本發明并將其付諸實踐效果,現將對參照附圖示出的示例性實施例進行描述,其中,在所有的各個示圖中,相同的標號指的是相同或功能相似的部件。根據本發明,以下的附圖和詳細描述被合并到此并形成說明書的一部分,并用于進一步示出實施例并解釋各種原理和優點,其中:
圖1是示出根據本發明的一些實施例的用于從輸入文字生成語音譜的方法的復合流程圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于摩托羅拉公司,未經摩托羅拉公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200610135662.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種紅外探測的方法以及更新閥值的方法
- 下一篇:直發器





