[發明專利]一種聲音模仿方法及裝置有效
| 申請號: | 201310423715.3 | 申請日: | 2013-09-17 |
| 公開(公告)號: | CN103489443A | 公開(公告)日: | 2014-01-01 |
| 發明(設計)人: | 趙歡;鄭睿;陳佐;張希翔;楊澤英 | 申請(專利權)人: | 湖南大學 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02;G10L19/04 |
| 代理公司: | 湖南兆弘專利事務所 43008 | 代理人: | 趙洪;譚武藝 |
| 地址: | 410082*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 聲音 模仿 方法 裝置 | ||
技術領域
本發明涉及語音信號處理領域,具體涉及一種聲音模仿方法及裝置。
背景技術
在語音信號處理技術的快速發展和社交平臺的流行推廣下,聲音模仿的相關研究凸顯其應用優勢并逐步占據重要位置。現有技術常見的聲音模仿方法均為針對聲道模型進行變化,其聲音模仿的效果不甚理想,存在聲音模擬相似度偏低的缺點。
公開號為CN102592590A的中國發明專利申請公開的技術方案記載了一種可任意調節的語音自然變聲方法及裝置提出將語音信號在聲道中進行建模,隨后求出發音的系統模型,即聲道的模型,之后再改變聲道的模型,最后在新的聲道模型中還原出語音信號。在一定程度了實現了聲音的音色變化,但并沒有從本質上達到聲音模擬的效果;公開號為CN101567132A的中國發明專利申請公開的技術方案記載了一種變聲裝置提出采用讀報發聲裝置的音頻調節裝置和音量調節裝置,使音頻調節裝置和音量調節裝置可以對讀報發聲裝置進行音頻和音量的自由調節,該裝置在音調和音量上實現了聲音的變化,但對聲音模仿中主要的音色沒有變化,實現的聲音模擬效果不甚理想。而且,目前聲音模仿系統普遍采用的是預存好音料的音料庫。雖然預存好的音料庫可以簡化采集音料的步驟,但這種方式大大局限了聲音模仿對象的可選擇性,缺少機動性和靈活性,并降低了基于聲音模仿方面的應用的趣味性。綜上所述,當前聲音模仿方法普遍存在聲音模擬效果不甚理想、聲音模擬相似度偏低、音料庫數據單一、無法增長、不可變化等問題。
發明內容
針對現有技術的上述問題,本發明要解決的技術問題是提供一種聲音模擬效果好、聲音模仿相似度較高、能夠實現音料庫自動擴展的聲音模仿方法及裝置。
為了解決上述技術問題,本發明采用的技術方案為:
一種聲音模仿方法,其實施步驟如下:
1)獲取說話人的語音信號及在音料庫中指定的模仿對象,將所述語音信號進行分幀加窗預處理,從所述預處理后的語音信號中選擇一個語音幀作為當前語音幀,跳轉執行下一步;
2)將當前語音幀根據音料庫中指定的模仿對象進行音調轉換及音色轉換;
3)將音調轉換及音色轉換后的結果重新合成得到合成語音幀;
4)將所述合成語音幀添加至模仿語音幀;
5)判斷所述語音信號的所有語音幀是否已經全部處理完畢,如果尚未處理完畢則選擇一個尚未處理的語音幀作為當前語音幀并跳轉執行步驟2),否則跳轉執行下一步;
6)將由所述模仿語音幀構成的模仿語音輸出。
作為本發明聲音模仿方法的進一步改進:
所述步驟2)中將當前語音幀根據音料庫中指定的模仿對象進行音調轉換的詳細步驟如下:
2.1.1)將當前語音幀進行線性預測分析;
2.1.2)根據線性預測分析得到的結果獲取當前語音幀的LPC殘差信號;
2.1.3)對所述LPC殘差信號進行離散傅立葉變換并計算幅度譜;
2.1.4)將離散傅立葉變換后的LPC殘差信號和以及所述幅度譜通過偽諧波語音模型構建得到偽諧波語音;
2.1.5)提取所述音料庫中指定的模仿對象的基音周期;
2.1.6)根據所述模仿對象的基音周期對偽諧波語音進行基音變換;
2.1.7)將基音變換后的偽諧波語音進行離散傅立葉逆變換得到的合成殘差新信號作為音調轉換的結果輸出。
所述步驟2)中將當前語音幀根據音料庫中指定的模仿對象進行音色轉換的詳細步驟如下:
2.2.1)將當前語音幀進行線性預測分析;
2.2.2)根據線性預測分析得到的結果獲取當前語音幀的聲道濾波器;
2.2.3)提取所述音料庫中指定的模仿對象的聲道濾波器;
2.2.4)將所述模仿對象的聲道濾波器替換當前語音幀的聲道濾波器作為音色轉換的結果。
所述步驟1)中將所述語音信號進行分幀加窗預處理之后還包括將語音信號作為模仿對象存入音料庫的步驟,所述將語音信號作為模仿對象存入音料庫的詳細步驟如下:
1.1)將當前語音幀進行線性預測分析;
1.2)根據線性預測分析得到的結果獲取當前語音幀的LPC殘差信號以及聲道濾波器;
1.3)將所述LPC殘差信號通過循環幅度平方和函數進行處理;
1.4)將通過循環幅度平方和函數處理后的LPC殘差信號提取說話人的基音周期;
1.5)將所述說話人的基音周期及聲道濾波器作為模仿對象的語音參數存入音料庫。
此外,本發明還提供一種聲音模仿裝置,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南大學,未經湖南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310423715.3/2.html,轉載請聲明來源鉆瓜專利網。





