[發(fā)明專(zhuān)利]一種實(shí)現(xiàn)語(yǔ)音歌唱化的方法和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201210591777.0 | 申請(qǐng)日: | 2012-12-31 |
| 公開(kāi)(公告)號(hào): | CN103915093B | 公開(kāi)(公告)日: | 2019-07-30 |
| 發(fā)明(設(shè)計(jì))人: | 孫見(jiàn)青;凌震華;江源;何婷婷;胡國(guó)平;胡郁;劉慶峰 | 申請(qǐng)(專(zhuān)利權(quán))人: | 科大訊飛股份有限公司 |
| 主分類(lèi)號(hào): | G10L15/04 | 分類(lèi)號(hào): | G10L15/04;G10L15/26;G10L15/28 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 230031 安徽*** | 國(guó)省代碼: | 安徽;34 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 簡(jiǎn)譜 目標(biāo)基頻 時(shí)長(zhǎng) 考察 音符 方法和裝置 語(yǔ)音片段 語(yǔ)音片斷 語(yǔ)音 接收用戶 時(shí)長(zhǎng)調(diào)整 信號(hào)轉(zhuǎn)換 語(yǔ)音信號(hào) 語(yǔ)音轉(zhuǎn)換 基頻 預(yù)置 節(jié)拍 唱歌 歌曲 | ||
本發(fā)明實(shí)施例公開(kāi)了一種實(shí)現(xiàn)語(yǔ)音歌唱化的方法和裝置,所述方法包括:接收用戶輸入的語(yǔ)音信號(hào);將所述語(yǔ)音信號(hào)切分獲得各基本考察單元的語(yǔ)音片斷;根據(jù)預(yù)置的簡(jiǎn)譜,確定簡(jiǎn)譜中的各音符與所述各基本考察單元的對(duì)應(yīng)關(guān)系;根據(jù)簡(jiǎn)譜中各音符的音高,和所述對(duì)應(yīng)關(guān)系,分別確定其所對(duì)應(yīng)的基本考察單元的目標(biāo)基頻值;根據(jù)簡(jiǎn)譜中各音符的節(jié)拍數(shù),和所述對(duì)應(yīng)關(guān)系,分別確定其所對(duì)應(yīng)的基本考察單元的目標(biāo)時(shí)長(zhǎng);根據(jù)所述目標(biāo)基頻值和目標(biāo)時(shí)長(zhǎng)調(diào)整各基本考察單元的語(yǔ)音片斷,使得調(diào)整后的語(yǔ)音片段的基頻為所述目標(biāo)基頻值,調(diào)整后的語(yǔ)音片段的時(shí)長(zhǎng)為所述目標(biāo)時(shí)長(zhǎng)。該方法避免了多次信號(hào)轉(zhuǎn)換的損失,實(shí)現(xiàn)了對(duì)任意長(zhǎng)度及任意內(nèi)容的語(yǔ)音向任意歌曲的唱歌語(yǔ)音轉(zhuǎn)換。
技術(shù)領(lǐng)域
本發(fā)明涉及語(yǔ)音信號(hào)處理領(lǐng)域,具體涉及一種實(shí)現(xiàn)語(yǔ)音歌唱化的方法和裝置。
背景技術(shù)
近年來(lái),歌唱合成系統(tǒng),即將用戶輸入的文本數(shù)據(jù)轉(zhuǎn)換為歌唱語(yǔ)音的方法以及得到了廣泛的研究和應(yīng)用。歌唱合成系統(tǒng)的實(shí)現(xiàn)首先要求錄制大量的歌曲數(shù)據(jù),包括語(yǔ)音數(shù)據(jù)和簡(jiǎn)譜數(shù)據(jù)等,以提供合成系統(tǒng)所需的語(yǔ)音片段或訓(xùn)練可靠的模型參數(shù)。然后,由于歌曲數(shù)據(jù)錄制的代價(jià)較大,歌唱合成系統(tǒng)通常只能選擇錄制某個(gè)特定發(fā)音人的數(shù)據(jù),相應(yīng)的提供的歌唱合成效果限定為特定發(fā)音人的音色,不適合個(gè)性化定制,無(wú)法實(shí)現(xiàn)到特定音色的演繹,特別是用戶自身音色的重現(xiàn)。
針對(duì)上述問(wèn)題,現(xiàn)有技術(shù)中開(kāi)發(fā)了一種歌唱合成方法,允許設(shè)備接收用戶以說(shuō)話風(fēng)格方式輸入的語(yǔ)音數(shù)據(jù),系統(tǒng)按照預(yù)設(shè)的簡(jiǎn)譜對(duì)語(yǔ)音數(shù)據(jù)進(jìn)行優(yōu)化實(shí)現(xiàn)歌曲合成。這種方式保留了用戶語(yǔ)音數(shù)據(jù)的音色,實(shí)現(xiàn)個(gè)性化合成。具體操作包括:(1)系統(tǒng)接收用戶說(shuō)話風(fēng)格的歌詞語(yǔ)音輸入;(2)通過(guò)人工切分的方式將語(yǔ)音信號(hào)切分為各個(gè)獨(dú)立的基于音素單元的語(yǔ)音片段;(3)并根據(jù)簡(jiǎn)譜標(biāo)注確定各音素單元和簡(jiǎn)譜音符的對(duì)應(yīng)關(guān)系;(4)系統(tǒng)從各音素單元的語(yǔ)音片段中提取聲學(xué)頻譜特征,基頻特征等;(5)系統(tǒng)根據(jù)簡(jiǎn)譜標(biāo)注信息確定目標(biāo)歌曲的基頻F0特征參數(shù)和時(shí)長(zhǎng)特征,并據(jù)此調(diào)整各音素單元的基頻特征和時(shí)長(zhǎng);(6)系統(tǒng)根據(jù)各音素單元的聲學(xué)頻譜特征,以及韻律特征(如:基頻特征及時(shí)長(zhǎng)特征等),合成歌唱語(yǔ)音輸出。
該現(xiàn)有技術(shù)雖然實(shí)現(xiàn)了從說(shuō)話風(fēng)格語(yǔ)音信號(hào)到歌唱風(fēng)格的轉(zhuǎn)換,但具有如下問(wèn)題:
一方面,該方案只能實(shí)現(xiàn)簡(jiǎn)譜對(duì)應(yīng)的歌詞的說(shuō)話風(fēng)格語(yǔ)音輸入的轉(zhuǎn)換。也就是說(shuō)用戶只能輸入指定歌曲的歌詞,無(wú)法實(shí)現(xiàn)對(duì)任意長(zhǎng)度的,任意內(nèi)容的歌曲合成效果轉(zhuǎn)換,應(yīng)用方法受限,同時(shí)也降低了娛樂(lè)效果;
進(jìn)一步,該方案通過(guò)人工切分方式,實(shí)現(xiàn)了說(shuō)話風(fēng)格的連續(xù)語(yǔ)音信號(hào)的切分,以及簡(jiǎn)譜音符的對(duì)應(yīng)。對(duì)人工要求較高,受到語(yǔ)種的限制,無(wú)法普適推廣。
而且,該方案采用的是參數(shù)合成方式,即首先將語(yǔ)音信號(hào)轉(zhuǎn)換為聲學(xué)特征,隨后在特征層面上按照歌唱標(biāo)準(zhǔn)進(jìn)行優(yōu)化,最后按照合成方式從優(yōu)化特征中合成得到連續(xù)語(yǔ)音信號(hào)。顯然從語(yǔ)音信號(hào)到特征參數(shù)的轉(zhuǎn)換,以及特征參數(shù)到語(yǔ)音信號(hào)的合成中均存在信號(hào)的損失,音質(zhì)有明顯的下降。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種實(shí)現(xiàn)語(yǔ)音歌唱化的方法和裝置,能夠自動(dòng)對(duì)語(yǔ)音進(jìn)行切分,而且可以將任意長(zhǎng)度和任意內(nèi)容的說(shuō)話語(yǔ)音轉(zhuǎn)換為用戶需要的歌曲。
本發(fā)明實(shí)施例提供了一種實(shí)現(xiàn)語(yǔ)音歌唱化的方法,所述方法包括:
接收用戶輸入的語(yǔ)音信號(hào);
將所述語(yǔ)音信號(hào)切分獲得各基本考察單元的語(yǔ)音片斷;
根據(jù)預(yù)置的簡(jiǎn)譜,確定簡(jiǎn)譜中的各音符與所述各基本考察單元的對(duì)應(yīng)關(guān)系;
根據(jù)簡(jiǎn)譜中各音符的音高,和所述對(duì)應(yīng)關(guān)系,分別確定其所對(duì)應(yīng)的基本考察單元的目標(biāo)基頻值;
根據(jù)簡(jiǎn)譜中各音符的節(jié)拍數(shù),和所述對(duì)應(yīng)關(guān)系,分別確定其所對(duì)應(yīng)的基本考察單元的目標(biāo)時(shí)長(zhǎng);
根據(jù)所述目標(biāo)基頻值和目標(biāo)時(shí)長(zhǎng)調(diào)整各基本考察單元的語(yǔ)音片斷,使得調(diào)整后的語(yǔ)音片段的基頻為所述目標(biāo)基頻值,調(diào)整后的語(yǔ)音片段的時(shí)長(zhǎng)為所述目標(biāo)時(shí)長(zhǎng)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于科大訊飛股份有限公司,未經(jīng)科大訊飛股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210591777.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L15-00 語(yǔ)音識(shí)別
G10L15-02 .語(yǔ)音識(shí)別的特征提取;識(shí)別單位的選擇
G10L15-04 .分段或字極限檢測(cè)
G10L15-06 .創(chuàng)建基準(zhǔn)模板;訓(xùn)練語(yǔ)音識(shí)別系統(tǒng),例如對(duì)說(shuō)話者聲音特征的適應(yīng)
G10L15-08 .語(yǔ)音分類(lèi)或檢索
G10L15-20 .專(zhuān)門(mén)適用于不利環(huán)境
- 基于語(yǔ)音轉(zhuǎn)換的情感語(yǔ)音生成方法
- 用于語(yǔ)者調(diào)適的基頻移動(dòng)量學(xué)習(xí)裝置、基頻生成裝置、移動(dòng)量學(xué)習(xí)方法、基頻生成方法及移動(dòng)量學(xué)習(xí)程序
- 一種用于參數(shù)化語(yǔ)音合成的基頻建模方法
- 一種音頻數(shù)據(jù)處理方法、裝置及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 聲學(xué)特征的確定方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種歌聲合成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 歌曲生成方法、裝置、可讀介質(zhì)及電子設(shè)備
- 音頻處理方法及裝置
- 一種數(shù)據(jù)處理方法以及設(shè)備
- 基頻獲取方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 控制遠(yuǎn)程服務(wù)調(diào)用頻率的方法和裝置
- 時(shí)長(zhǎng)記錄方法、藍(lán)牙從設(shè)備與時(shí)長(zhǎng)記錄系統(tǒng)
- 音素時(shí)長(zhǎng)預(yù)測(cè)建模方法及音素時(shí)長(zhǎng)預(yù)測(cè)方法
- 時(shí)長(zhǎng)顯示方法和時(shí)長(zhǎng)顯示裝置
- 預(yù)估接駕時(shí)長(zhǎng)方法及預(yù)估接駕時(shí)長(zhǎng)系統(tǒng)
- 一種監(jiān)控學(xué)生學(xué)習(xí)進(jìn)度的方法及終端
- 一種可根據(jù)不同人群調(diào)節(jié)交通信號(hào)燈時(shí)長(zhǎng)的系統(tǒng)
- 運(yùn)動(dòng)時(shí)長(zhǎng)測(cè)試器
- 配送時(shí)長(zhǎng)獲取、配送時(shí)長(zhǎng)預(yù)測(cè)模型生成的方法、裝置
- 物流運(yùn)單時(shí)效推送方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)





