[發明專利]自動生成重讀音節語音的方法和系統在審
| 申請號: | 201110270759.8 | 申請日: | 2011-09-14 |
| 公開(公告)號: | CN102436807A | 公開(公告)日: | 2012-05-02 |
| 發明(設計)人: | 王歡良;鄒平 | 申請(專利權)人: | 蘇州思必馳信息科技有限公司 |
| 主分類號: | G10L13/00 | 分類號: | G10L13/00;G10L15/00;G10L15/02 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 215123 江蘇省蘇州工*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 自動 生成 重讀 音節 語音 方法 系統 | ||
技術領域
本發明涉及語音信號領域,具體地說,尤其是涉及一種自動生成重讀音節語音的系統及方法。?
背景技術
在言語交流中,為了表示強調或者引起關注,人們通常需要對語音中的某些音節進行重讀。在某些語言中,重讀位置的不同也會影響詞語所表達的意思。此外,語言的抑揚頓挫主要依賴于重讀位置和強度的控制。?
當前計算機已被廣泛應用于語音處理領域。計算機可以通過語音的聲學特征來判斷語音中重讀音節的位置,也可以通過語音合成技術來生成帶有重讀音節的語音。語音合成技術通過預先訓練的模型可以把一段文本轉換成對應的語音。該合成語音的重音位置和輸入文本內容直接相關,是通過文本分析確定的,如專利申請CN101223572A所述的。此外,合成的語音通常是特定人的,且自然度難以保證。而在一些實際應用場景中,需要計算機對一段輸入語音進行處理,輸出指定音節重讀的語音。比如在計算機輔助的口語教學習系統中,對于用戶發音錯誤的位置,需要系統播放錯誤位置重讀的標準音來提示用戶;或者系統自動生成重讀位置不同的語音,讓學習者來區分或者聽辨不同的詞。?
為了控制語音的重音位置,現有方法主要是通過預先錄制同一單詞不同重音位置的讀法,然后通過簡單重組重音音素來產生音節重讀的語音,如專利申請CN1474318A所述的。這種方法是非常低效,難以保證生成語音的自然度。?
發明內容
為了解決上述問題,本發明公開一種自動生成重讀音節語音的系統和方法。該系統可以對接收到的語音進行處理,使得任意指定音節的語音變為重讀,而不影響原始語音的可懂度、自然度和音質。該系統可用于口語語言教學任務中,用來生成反饋指導信息或者重讀聽辨練習。?
原理上,本發明利用預先學習得到的特征變換參數矩陣,通過對輸入語音指定音節以及相關音素聲學特征進行修正,然后重新合成來自動生成重讀音節語音。?
本發明采用如下的技術方案:?
一種自動生成重讀音節語音的系統,包括:?
音素定位模塊,用于確定接收到的語音信號中每個音素的位置,得到每個詞、音節和音?素的時間邊界;?
特征提取模塊,用于從語音信號中提取和音節重讀相關的特征以及頻譜特征;?
特征修正模塊,用于利用預先估計出的特征變換參數,把輸入語音特征參數調整為對應的表示給定音節重讀的特征參數,并對調整后的特征參數進行平滑處理;?
語音重構模塊,用于采用修正后的語音聲學特征參數通過源-濾波器模型重新合成語音;?
特征變換參數庫,用于存放統計的每個音素從非重讀到重讀的聲學特征的變換矩陣參數。?
以及一種自動生成重讀音節語音的方法,包括如下步驟:?
步驟1、通過語音識別技術獲得輸入語音的詞、音節以及音素的時間邊界;?
步驟2、從輸入語音中提取每個音素的重音相關特征和頻譜特征;?
步驟3、根據音素類型和相對重讀音節的位置,從特征變換參數庫中獲取每個音素對應的特征變換矩陣,通過下式計算特定音節重讀之后語音中每個音素的重音相關特征向量:?
其中:Vi(xp)表示輸入語音中音素xp的第i個特征向量,p表示音素x相對于重讀音節的位置類型,A(xp)表示位置類型為p的音素x的變換矩陣,?表示位置類型為p的音素x的第i個特征向量變換后的特征向量;?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州思必馳信息科技有限公司,未經蘇州思必馳信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110270759.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:香蕉莖稈有機肥及其制備方法
- 下一篇:一種電源模塊地址的采樣方法及相關裝置





