[發明專利]基于徑向基神經網絡的耳語音轉換為正常語音的方法無效
| 申請號: | 200910025321.6 | 申請日: | 2009-03-10 |
| 公開(公告)號: | CN101527141A | 公開(公告)日: | 2009-09-09 |
| 發明(設計)人: | 陶智;趙鶴鳴;顧濟華;韓韜;陳大慶;許宜申;吳迪;張曉俊 | 申請(專利權)人: | 蘇州大學 |
| 主分類號: | G10L21/02 | 分類號: | G10L21/02 |
| 代理公司: | 蘇州創元專利商標事務所有限公司 | 代理人: | 陶海鋒 |
| 地址: | 215123江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 徑向 神經網絡 耳語 轉換 正常 語音 方法 | ||
技術領域
本發明屬于語音信號處理技術領域,特別涉及耳語音轉換為正常語音技術。
背景技術
耳語音是一種有別于正常語音的發音模式,其主要特點是發音時音量低且聲帶完全不振動。在某些場合說話時,人們為了不影響他人或為了對話的保密性,常常使用耳語方式。然而由于耳語發音的特殊性和受對話環境的影響,這種方式下的語音信號不僅信噪比低而且可懂度、清晰度都較差,特別是在通過通訊設備進行交流時,既影響通話質量,又易使人產生疲勞。另外一些嗓音病人或發音功能不正常者交流時也只能使用耳語方式,影響了交流。
目前國內外關于耳語音轉換的研究較少,已有的方法有:1、使用線性預測法(LPC)實現耳語音的重建,通過提取耳語音的偏相關系數構成斜格型合成濾波器進行合成,其遇到的問題,一是耳語音的共振峰不易提取,二是在該方法中,認為耳語音與正常語音的共振峰結構大致不變,但實際上耳語音的共振峰頻率是向高頻偏移的,所以恢復出的語音往往不能讓人準確聽辨;2、采用混合激勵線性預測模型(MELP)重建耳語音,將語音分為五個頻帶,并將四個低頻帶作為濁音段激勵,高頻段作為清音段激勵,這樣重建的語音帶有明顯的失真;3、基于同態信號處理方法并結合相對熵聲韻分割的耳語重建系統,在對耳語音聲韻分割后,使用同態信號處理方法得到聲道響應序列,根據音調加入基頻,由于耳語音傳輸函數有別于正常語音,雖然經過了一些后處理但是轉換語音的自然度不高。
發明內容
本發明目的是提供一種將耳語音轉換為正常語音的方法,使得恢復的語音在可懂度以及音質上均達到比較好的效果,以更方便人們的交流。
為達到上述目的,本發明采用的技術方案是:一種基于徑向基神經網絡的耳語音轉換為正常語音的方法,包括訓練步驟和轉換步驟,
所述訓練步驟為,分別提取出相同發音內容的耳語音和正常語音的線譜對參數,使用徑向基神經網絡對耳語音、正常語音的線譜對參數進行訓練,捕獲耳語音、正常語音頻譜包絡的映射關系;
所述轉換步驟為,提取待轉換的耳語音的線譜對參數,使用已訓練好的徑向基神經網絡進行轉換,獲得對應于正常語音的線譜對參數,并使用線譜對參數合成器轉換出正常語音。
上文中,通過使用徑向基神經網絡,創造性地提出了利用耳語音和正常語音的線譜對參數間的關聯性,實現耳語音和正常語音的轉換。其中,在獲得正常語音的線譜對參數后,用線譜對參數合成器進行合成轉換出正常語音是現有技術。進行語音合成時,需要提供激勵源,激勵源分為濁音源和清音源兩種,發濁音時聲帶不斷張開和關閉,將產生間歇的脈沖波。這個脈沖的波形類似于斜三角的脈沖。它的數學表達式如下:
式中,N1=0.5N為斜三角波上升部分的時間,N2=0.35N為其下降部分的時間,N為語音基音周期的時間。選取語音基頻平均值為基音頻率。
發清音時,無論是發阻塞音或摩擦音,聲道都被阻礙形成湍流。所以,可以把清音激勵模擬成隨機白噪聲。實際情況下一般使用均值為0的、方差為1的,并在時間或/和幅值上為白色分布的序列。
利用上述激勵源,將經過已訓練徑向基神經網絡轉換后的耳語音線譜對參數構成合成器,通過線譜對參數合成器轉換出正常語音。
上述技術方案中,所述訓練步驟中,獲取耳語音的線譜對參數的方法為,獲取采樣率不低于10KHz的音頻文件,進行下列處理,
(1)預處理:先采用一階數字濾波器進行預加重處理,所述一階數字濾波器為H(z)=1-uz-1,式中,H是傳遞函數,z是z變換,u為預加重系數,其取值為0.9<u<1;
再進行分幀加窗處理,每幀時間長度為20~30毫秒,幀長取2的整數次方,幀移與幀長的比值為1/4~1/2,采用漢明窗進行加窗處理,
式中,n為加窗點,N為漢明窗的窗長,w為漢明窗;
(2)線譜對分析:對經過預處理后的耳語音提取線譜對參數(wi、θi),并且wi、θi按下式關系排列:
0<w1<θ1<…<wp/2<θ?p/2<π,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州大學,未經蘇州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910025321.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種新型電子報警防盜方法及系統
- 下一篇:充電控制電路





