[發明專利]自動生成重讀音節語音的方法和系統在審

申請號：	201110270759.8	申請日：	2011-09-14
公開（公告）號：	CN102436807A	公開（公告）日：	2012-05-02
發明（設計）人：	王歡良;鄒平	申請（專利權）人：	蘇州思必馳信息科技有限公司
主分類號：	G10L13/00	分類號：	G10L13/00;G10L15/00;G10L15/02
代理公司：	暫無信息	代理人：	暫無信息
地址：	215123 江蘇省蘇州工***	國省代碼：	江蘇;32
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	自動生成重讀音節語音方法系統
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及語音信號領域，具體地說，尤其是涉及一種自動生成重讀音節語音的系統及方法。?

背景技術

在言語交流中，為了表示強調或者引起關注，人們通常需要對語音中的某些音節進行重讀。在某些語言中，重讀位置的不同也會影響詞語所表達的意思。此外，語言的抑揚頓挫主要依賴于重讀位置和強度的控制。?

當前計算機已被廣泛應用于語音處理領域。計算機可以通過語音的聲學特征來判斷語音中重讀音節的位置，也可以通過語音合成技術來生成帶有重讀音節的語音。語音合成技術通過預先訓練的模型可以把一段文本轉換成對應的語音。該合成語音的重音位置和輸入文本內容直接相關，是通過文本分析確定的，如專利申請CN101223572A所述的。此外，合成的語音通常是特定人的，且自然度難以保證。而在一些實際應用場景中，需要計算機對一段輸入語音進行處理，輸出指定音節重讀的語音。比如在計算機輔助的口語教學習系統中，對于用戶發音錯誤的位置，需要系統播放錯誤位置重讀的標準音來提示用戶；或者系統自動生成重讀位置不同的語音，讓學習者來區分或者聽辨不同的詞。?

為了控制語音的重音位置，現有方法主要是通過預先錄制同一單詞不同重音位置的讀法，然后通過簡單重組重音音素來產生音節重讀的語音，如專利申請CN1474318A所述的。這種方法是非常低效，難以保證生成語音的自然度。?

發明內容

為了解決上述問題，本發明公開一種自動生成重讀音節語音的系統和方法。該系統可以對接收到的語音進行處理，使得任意指定音節的語音變為重讀，而不影響原始語音的可懂度、自然度和音質。該系統可用于口語語言教學任務中，用來生成反饋指導信息或者重讀聽辨練習。?

原理上，本發明利用預先學習得到的特征變換參數矩陣，通過對輸入語音指定音節以及相關音素聲學特征進行修正，然后重新合成來自動生成重讀音節語音。?

本發明采用如下的技術方案：?

一種自動生成重讀音節語音的系統，包括：?

音素定位模塊，用于確定接收到的語音信號中每個音素的位置，得到每個詞、音節和音?素的時間邊界；?

特征提取模塊，用于從語音信號中提取和音節重讀相關的特征以及頻譜特征；?

特征修正模塊，用于利用預先估計出的特征變換參數，把輸入語音特征參數調整為對應的表示給定音節重讀的特征參數，并對調整后的特征參數進行平滑處理；?

語音重構模塊，用于采用修正后的語音聲學特征參數通過源-濾波器模型重新合成語音；?

特征變換參數庫，用于存放統計的每個音素從非重讀到重讀的聲學特征的變換矩陣參數。?

以及一種自動生成重讀音節語音的方法，包括如下步驟：?