[發(fā)明專利]一種語(yǔ)音信號(hào)的處理方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201410763961.8 | 申請(qǐng)日: | 2014-12-11 |
| 公開(kāi)(公告)號(hào): | CN104575487A | 公開(kāi)(公告)日: | 2015-04-29 |
| 發(fā)明(設(shè)計(jì))人: | 田彪 | 申請(qǐng)(專利權(quán))人: | 百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
| 主分類(lèi)號(hào): | G10L13/02 | 分類(lèi)號(hào): | G10L13/02 |
| 代理公司: | 北京鴻德海業(yè)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 語(yǔ)音 信號(hào) 處理 方法 裝置 | ||
【技術(shù)領(lǐng)域】
本發(fā)明涉及音頻處理技術(shù)領(lǐng)域,尤其涉及一種語(yǔ)音信號(hào)的處理方法及裝置。
【背景技術(shù)】
互聯(lián)網(wǎng)資源一般采用文本格式或者語(yǔ)音格式輸出,其中,語(yǔ)音格式的互聯(lián)網(wǎng)資源一般是由自然人錄制的,因此為了提高語(yǔ)音格式的互聯(lián)網(wǎng)資源的生成效率,目前采用語(yǔ)音合成技術(shù)對(duì)文本格式的互聯(lián)網(wǎng)資源進(jìn)行自動(dòng)轉(zhuǎn)換處理來(lái)獲得語(yǔ)音格式的互聯(lián)網(wǎng)資源。
然而,現(xiàn)有技術(shù)中因?yàn)槌杀鞠拗?,利用語(yǔ)音合成技術(shù)對(duì)文本格式的互聯(lián)網(wǎng)資源進(jìn)行轉(zhuǎn)換過(guò)程中,需要使用的聲音模型庫(kù)中一般只有幾種語(yǔ)料,使得輸出的語(yǔ)音格式的互聯(lián)網(wǎng)資源只有固定的一種或幾種聲音,因此語(yǔ)音信號(hào)的聲音單一,缺乏變化,長(zhǎng)久使用,重復(fù)率較高。
【發(fā)明內(nèi)容】
有鑒于此,本發(fā)明實(shí)施例提供了一種語(yǔ)音信號(hào)的處理方法及裝置,可以實(shí)現(xiàn)對(duì)語(yǔ)音信號(hào)進(jìn)行變音處理,用以提高語(yǔ)音信號(hào)的多樣性。
本發(fā)明實(shí)施例的一方面,提供一種語(yǔ)音信號(hào)的處理方法,包括:
獲得文本信息;
對(duì)所述文本信息進(jìn)行轉(zhuǎn)換處理,以獲得第一語(yǔ)音信號(hào);
對(duì)所述第一語(yǔ)音信號(hào)進(jìn)行變音處理,以獲得第二語(yǔ)音信號(hào)。
如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述對(duì)所述第一語(yǔ)音信號(hào)進(jìn)行變音處理,以獲得第二語(yǔ)音信號(hào),包括:
獲得變音參數(shù),所述變音參數(shù)包括以下參數(shù)中至少一個(gè):音效、音色、音調(diào)和音速;
依據(jù)所述變音參數(shù),對(duì)所述第一語(yǔ)音信號(hào)進(jìn)行變音處理,以獲得所述第二語(yǔ)音信號(hào)。
如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述獲得變音參數(shù),包括:
獲得輸入的所述變音參數(shù);或者,
獲得變音模式,以及依據(jù)所述變音模式在變音資源庫(kù)中進(jìn)行匹配,以獲得所述變音模式對(duì)應(yīng)的變音參數(shù)。
如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述依據(jù)所述變音參數(shù),對(duì)所述第一語(yǔ)音信號(hào)進(jìn)行變音處理,以獲得第二語(yǔ)音信號(hào),包括:
依據(jù)獲得的所述變音參數(shù),確定所述第一語(yǔ)音信號(hào)中需要修改的至少一個(gè)語(yǔ)音信號(hào)特征值;
依據(jù)所述變音參數(shù),修改所述至少一個(gè)語(yǔ)音信號(hào)特征值,以獲得所述第二語(yǔ)音信號(hào)。
如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述對(duì)所述文本信息進(jìn)行轉(zhuǎn)換處理,以獲得第一語(yǔ)音信號(hào),包括:
對(duì)所述文本信息進(jìn)行分析處理,以獲得文本分析結(jié)果和發(fā)音提示信息;
依據(jù)所述發(fā)音提示信息,獲得語(yǔ)音信號(hào)特征;
依據(jù)所述文本分析結(jié)果、發(fā)音提示信息和所述語(yǔ)音信號(hào)特征,進(jìn)行語(yǔ)音合成處理,以獲得所述第一語(yǔ)音信號(hào)。
本發(fā)明實(shí)施例的一方面,提供一種語(yǔ)音信號(hào)的處理裝置,包括:
信息獲取模塊,用于獲得文本信息;
信息轉(zhuǎn)換模塊,用于對(duì)所述信息獲取模塊獲得的所述文本信息進(jìn)行轉(zhuǎn)換處理,以獲得第一語(yǔ)音信號(hào);
語(yǔ)音變音模塊,用于對(duì)所述信息轉(zhuǎn)換模塊獲得的所述第一語(yǔ)音信號(hào)進(jìn)行變音處理,以獲得第二語(yǔ)音信號(hào)。
如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述語(yǔ)音變音模塊,具體用于:
獲得變音參數(shù),所述變音參數(shù)包括以下參數(shù)中至少一個(gè):音效、音色、音調(diào)和音速;
依據(jù)所述變音參數(shù),對(duì)所述第一語(yǔ)音信號(hào)進(jìn)行變音處理,以獲得所述第二語(yǔ)音信號(hào)。
如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述語(yǔ)音變音模塊用于獲得變音參數(shù)時(shí),具體用于:
獲得輸入的所述變音參數(shù);或者,
獲得變音模式,以及依據(jù)所述變音模式在變音資源庫(kù)中進(jìn)行匹配,以獲得所述變音模式對(duì)應(yīng)的變音參數(shù)。
如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述語(yǔ)音變音模塊用于依據(jù)所述變音參數(shù),對(duì)所述第一語(yǔ)音信號(hào)進(jìn)行變音處理,以獲得第二語(yǔ)音信號(hào)時(shí),具體用于:
依據(jù)獲得的所述變音參數(shù),確定所述第一語(yǔ)音信號(hào)中需要修改的至少一個(gè)語(yǔ)音信號(hào)特征值;
依據(jù)所述變音參數(shù),修改所述至少一個(gè)語(yǔ)音信號(hào)特征值,以獲得所述第二語(yǔ)音信號(hào)。
如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述信息轉(zhuǎn)換模塊,具體用于:
對(duì)所述文本信息進(jìn)行分析處理,以獲得文本分析結(jié)果和發(fā)音提示信息;
依據(jù)所述發(fā)音提示信息,獲得語(yǔ)音信號(hào)特征;
依據(jù)所述文本分析結(jié)果、發(fā)音提示信息和所述語(yǔ)音信號(hào)特征,進(jìn)行語(yǔ)音合成處理,以獲得所述第一語(yǔ)音信號(hào)。
由以上技術(shù)方案可以看出,本發(fā)明實(shí)施例具有以下有益效果:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司;,未經(jīng)百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司;許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410763961.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類(lèi)專利
- 專利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L13-00 語(yǔ)音合成;文本-語(yǔ)音合成系統(tǒng)
G10L13-02 .產(chǎn)生合成語(yǔ)音的方法;語(yǔ)音合成設(shè)備
G10L13-06 .語(yǔ)音合成設(shè)備中使用的基本語(yǔ)音單位;級(jí)聯(lián)規(guī)則
G10L13-08 .文本分析或文本以外的語(yǔ)音合成參數(shù)的產(chǎn)生,例如語(yǔ)義圖翻譯為音素、韻律產(chǎn)生、重音或聲調(diào)測(cè)定
G10L13-04 ..語(yǔ)音合成系統(tǒng)的零部件,例如合成設(shè)備結(jié)構(gòu)或存儲(chǔ)器管理
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 亮度信號(hào)/色信號(hào)分離裝置和亮度信號(hào)/色信號(hào)分離方法
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 雙耳信號(hào)的信號(hào)生成
- 雙耳信號(hào)的信號(hào)生成
- 信號(hào)處理裝置、信號(hào)處理方法、信號(hào)處理程序
- USBTYPEC信號(hào)轉(zhuǎn)HDMI信號(hào)的信號(hào)轉(zhuǎn)換線
- 信號(hào)盒(信號(hào)轉(zhuǎn)換)
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





