[發(fā)明專利]基于小波變換的高質(zhì)量聲音變換方法在審
| 申請(qǐng)?zhí)枺?/td> | 201810234234.0 | 申請(qǐng)日: | 2018-03-21 |
| 公開(公告)號(hào): | CN108492832A | 公開(公告)日: | 2018-09-04 |
| 發(fā)明(設(shè)計(jì))人: | 羅森林;張寒青;潘麗敏;袁曉筱 | 申請(qǐng)(專利權(quán))人: | 北京理工大學(xué) |
| 主分類號(hào): | G10L21/007 | 分類號(hào): | G10L21/007;G10L19/02 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100081 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音信號(hào) 變調(diào) 小波變換 高質(zhì)量聲音 語音轉(zhuǎn)換 算法 語音 原始語音信號(hào) 加窗處理 實(shí)時(shí)性差 語音特征 規(guī)整 復(fù)雜度 感知度 實(shí)時(shí)性 預(yù)加重 重采樣 轉(zhuǎn)折區(qū) 采樣 分幀 時(shí)長 轉(zhuǎn)折 檢測 轉(zhuǎn)換 保留 | ||
本發(fā)明針對(duì)傳統(tǒng)實(shí)時(shí)變聲算法如WSOLA算法等復(fù)雜度高、實(shí)時(shí)性差和轉(zhuǎn)換語音質(zhì)量低的問題,提出了基于小波變換的高質(zhì)量聲音變換方法。首先運(yùn)用重采樣的方法對(duì)原始語音信號(hào)先進(jìn)行變調(diào)處理,變調(diào)后的語音信號(hào)時(shí)長會(huì)發(fā)生改變。然后對(duì)變調(diào)后的語音信號(hào)進(jìn)行預(yù)加重、分幀和加窗處理。接著通過小波變換的方法獲得當(dāng)前幀的語音特征。根據(jù)該特征,對(duì)語音信號(hào)的轉(zhuǎn)折部分做出檢測與確定,通過保留轉(zhuǎn)折區(qū)語音信號(hào)不變的方式提高語音信號(hào)的感知度。最后,為了提高語音轉(zhuǎn)換的實(shí)時(shí)性,采用了點(diǎn)采樣的方式進(jìn)行語音規(guī)整完成語音轉(zhuǎn)換。
技術(shù)領(lǐng)域
本發(fā)明提出了基于小波變換的高質(zhì)量聲音變換方法。屬于計(jì)算機(jī)與信息科學(xué)領(lǐng)域。
背景技術(shù)
在語音信號(hào)的分析和處理中,變聲技術(shù)是一個(gè)引人矚目的研究領(lǐng)域。人類語音是人與人之間交換信息中最有效、最快捷的一種傳遞方式,在信息時(shí)代中,使用數(shù)字方式去存儲(chǔ)、合成和增強(qiáng)語音已經(jīng)是現(xiàn)代通信中一種很普遍的手段了,由此出現(xiàn)的語音變換技術(shù),也成為了網(wǎng)絡(luò)聊天、數(shù)字娛樂和安全領(lǐng)域中的熱門應(yīng)用。
語音變換目前有兩個(gè)主要的發(fā)展方向,一種是特定目標(biāo)人變聲,一種是語音性別變換。本專利的研究方向?qū)儆谡Z音性別變換,語音性別變換的主要任務(wù)是修改語音的音調(diào)參數(shù)從而產(chǎn)生性別變換的特效,如在男聲、女聲、童聲之間相互轉(zhuǎn)換,達(dá)到偽裝效果。
在語音性別變換中,首先會(huì)對(duì)語音信號(hào)進(jìn)行重采樣處理。重采樣后的信號(hào)會(huì)引起信號(hào)頻譜的壓縮和擴(kuò)展,從而可以達(dá)到語音變調(diào)的處理。與此同時(shí),重采樣后的語音信號(hào)時(shí)長也會(huì)發(fā)生變化。為了和原語音時(shí)長保持一致,這時(shí)需要對(duì)語音時(shí)長進(jìn)行規(guī)整處理。目前國內(nèi)外學(xué)者對(duì)語音時(shí)長規(guī)整的算法研究大致可以分為三類,即時(shí)間域的處理方法、頻率域的處理方法以及參量模型法。頻域處理方法和參量模型法涉及到的參數(shù)較多、計(jì)算復(fù)雜度較高,而較高的復(fù)雜度和過多的參數(shù)也限制了這兩種處理方法在實(shí)時(shí)處理中的應(yīng)用。然而,時(shí)域的處理方法雖然具備較低的算法復(fù)雜度,能達(dá)到實(shí)時(shí)處理的性能要求,但是處理后的語音轉(zhuǎn)換效果較差。
綜合上述所述,針對(duì)現(xiàn)有的實(shí)時(shí)語音變換技術(shù)中復(fù)雜度高、實(shí)時(shí)性差和轉(zhuǎn)換語音質(zhì)量低的問題,本發(fā)明提出了基于小波變換的高質(zhì)量聲音變換方法。
發(fā)明內(nèi)容
本發(fā)明的目的是:針對(duì)常見的實(shí)時(shí)變聲系統(tǒng)中語音時(shí)長規(guī)整的WSOLA算法合成的語音質(zhì)量不高、實(shí)時(shí)效率偏低的問題,提出基于小波變換的高質(zhì)量聲音變換方法,通過保留語音轉(zhuǎn)折區(qū)來提高語音信號(hào)感知度,并運(yùn)用點(diǎn)采樣方法提高語音規(guī)整效率,讓變聲具有較好的語音自然度。
本發(fā)明的設(shè)計(jì)原理為:首先運(yùn)用重采樣的方法對(duì)原始語音信號(hào)進(jìn)行變調(diào)處理,變調(diào)后的語音信號(hào)時(shí)長會(huì)發(fā)生改變,然后對(duì)變調(diào)后的語音信號(hào)進(jìn)行預(yù)加重、分幀和加窗處理,接著通過小波變換的方法獲得當(dāng)前幀的語音特征,根據(jù)該特征,對(duì)語音信號(hào)的轉(zhuǎn)折部分做出檢測與確定,通過保留轉(zhuǎn)折區(qū)語音信號(hào)不變的方式提高語音信號(hào)的感知度,最后,為了提高語音轉(zhuǎn)換的實(shí)時(shí)性,采用了點(diǎn)采樣的方式進(jìn)行語音規(guī)整完成語音轉(zhuǎn)換。
本發(fā)明的技術(shù)方案是通過如下步驟實(shí)現(xiàn)的:
步驟1,基于重采樣的語音變調(diào)處理。
步驟2,對(duì)語音信號(hào)分幀提取特征信息,確定語音信號(hào)中的語音轉(zhuǎn)折區(qū)。
步驟2.1,對(duì)變調(diào)后的信號(hào)進(jìn)行預(yù)加重、分幀和加窗處理。
步驟2.2,對(duì)加窗處理后的幀進(jìn)行離散小波分解。
步驟2.3,離散小波分解后輸出處理得到幀的語音特征。
步驟3,根據(jù)當(dāng)前幀的語音特征判斷是否為語音轉(zhuǎn)折區(qū)。如果不是轉(zhuǎn)折區(qū)進(jìn)行第四步,否則將當(dāng)前幀直接輸出。
步驟4,規(guī)整語音時(shí)長,并進(jìn)行語音合成。
步驟4.1,通過點(diǎn)采樣方法尋找當(dāng)前幀領(lǐng)域內(nèi)最相似的幀。
步驟4.2,根據(jù)規(guī)整結(jié)果進(jìn)行語音合成。
有益效果
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京理工大學(xué),未經(jīng)北京理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810234234.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 信息處理設(shè)備、方法和記錄媒體
- 語音信號(hào)處理電路和裝置
- 一種判斷說話人數(shù)目的方法及系統(tǒng)
- 基于人工智能的語音信號(hào)處理方法、裝置及存儲(chǔ)介質(zhì)
- 環(huán)境語音采集處理方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 語音識(shí)別方法、裝置、電子設(shè)備以及存儲(chǔ)介質(zhì)
- 語音信號(hào)的處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 語音信號(hào)處理方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種語音信號(hào)處理方法、裝置、介質(zhì)和設(shè)備
- 一種雙路語音同傳的收發(fā)系統(tǒng)





