[發(fā)明專利]一種實(shí)現(xiàn)語音歌唱化的方法和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201210591777.0 | 申請(qǐng)日: | 2012-12-31 |
| 公開(公告)號(hào): | CN103915093B | 公開(公告)日: | 2019-07-30 |
| 發(fā)明(設(shè)計(jì))人: | 孫見青;凌震華;江源;何婷婷;胡國(guó)平;胡郁;劉慶峰 | 申請(qǐng)(專利權(quán))人: | 科大訊飛股份有限公司 |
| 主分類號(hào): | G10L15/04 | 分類號(hào): | G10L15/04;G10L15/26;G10L15/28 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 230031 安徽*** | 國(guó)省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 簡(jiǎn)譜 目標(biāo)基頻 時(shí)長(zhǎng) 考察 音符 方法和裝置 語音片段 語音片斷 語音 接收用戶 時(shí)長(zhǎng)調(diào)整 信號(hào)轉(zhuǎn)換 語音信號(hào) 語音轉(zhuǎn)換 基頻 預(yù)置 節(jié)拍 唱歌 歌曲 | ||
1.一種實(shí)現(xiàn)語音歌唱化的方法,其特征在于,所述方法包括:
接收用戶輸入的語音信號(hào);
將所述語音信號(hào)切分獲得各基本考察單元的語音片斷;
根據(jù)預(yù)置的簡(jiǎn)譜,確定簡(jiǎn)譜中的各音符與所述各基本考察單元的對(duì)應(yīng)關(guān)系;
根據(jù)簡(jiǎn)譜中各音符的音高,和所述對(duì)應(yīng)關(guān)系,分別確定其所對(duì)應(yīng)的基本考察單元的目標(biāo)基頻值;
根據(jù)簡(jiǎn)譜中各音符的節(jié)拍數(shù),和所述對(duì)應(yīng)關(guān)系,分別確定其所對(duì)應(yīng)的基本考察單元的目標(biāo)時(shí)長(zhǎng);
根據(jù)所述目標(biāo)基頻值和目標(biāo)時(shí)長(zhǎng)調(diào)整各基本考察單元的語音片斷,使得調(diào)整后的語音片段的基頻為所述目標(biāo)基頻值,調(diào)整后的語音片段的時(shí)長(zhǎng)為所述目標(biāo)時(shí)長(zhǎng),以得到所述語音信號(hào)向唱歌語音的轉(zhuǎn)換結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述語音信號(hào)切分獲得各基本考察單元的語音片斷,具體包括:
從語音信號(hào)中逐幀提取語音聲學(xué)特征矢量,生成聲學(xué)特征矢量序列;
對(duì)所述聲學(xué)特征矢量序列執(zhí)行語音識(shí)別,確定基本語音識(shí)別單元模型序列及各基本語音識(shí)別單元模型對(duì)應(yīng)的語音片段;
合并所述基本語音識(shí)別單元模型對(duì)應(yīng)的語音片段得到基本考察單元的語音片段。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,
所述基本語音識(shí)別單元模型,包括:靜音識(shí)別模型,濁音識(shí)別模型和清音識(shí)別模型三種;
所述合并基本語音識(shí)別單元模型對(duì)應(yīng)的語音片段得到基本考察單元的語音片斷,包括:將濁音片斷和清音片斷合并構(gòu)成基本考察單元的語音片斷。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,
所述基本語音識(shí)別單元模型,包括:各音素識(shí)別模型或音節(jié)識(shí)別模型;
所述合并基本語音識(shí)別單元模型對(duì)應(yīng)的語音片段得到基本考察單元的語音片斷,包括:將相鄰音素單元片斷合并構(gòu)成基于音節(jié)的基本考察單元的語音片斷。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)預(yù)置的簡(jiǎn)譜,確定簡(jiǎn)譜中的音符與基本考察單元的對(duì)應(yīng)關(guān)系,具體包括:
獲取用戶輸入的語音信號(hào)所對(duì)應(yīng)的基本考察單元的個(gè)數(shù)K;
獲得簡(jiǎn)譜子片斷序列;
依次統(tǒng)計(jì)每個(gè)子片段中音符的個(gè)數(shù)M;
判斷當(dāng)前子片段中音符的個(gè)數(shù)M是否大于所述基本考察單元個(gè)數(shù)K,如果M大于K,根據(jù)如下式子獲取參數(shù)r,
將基本考察單元序列復(fù)制r遍順序拼接,其中,復(fù)制后的總的基本考察單元個(gè)數(shù)為rK,滿足rK<=M;
將所述復(fù)制后的rK個(gè)基本考察單元,與所述簡(jiǎn)譜子片段中的M個(gè)音符進(jìn)行線性對(duì)齊。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述將所述復(fù)制后的rK個(gè)基本考察單元,與所述簡(jiǎn)譜子片段中的M個(gè)音符,進(jìn)行線性對(duì)齊,具體包括:
根據(jù)公式:NotIdxj=[j*rK/M],將所述復(fù)制后的rK個(gè)基本考察單元,與所述簡(jiǎn)譜子片段中的M個(gè)音符,進(jìn)行線性對(duì)齊;
所述NotIdxj表示簡(jiǎn)譜子片段中第j個(gè)音符所對(duì)應(yīng)基本考察單元的序號(hào),[j*rK/M]表示對(duì)j*rK/M四舍五入取整。
7.根據(jù)權(quán)利要求5所述的方法,其特征在于,當(dāng)判斷當(dāng)前音符子片段中音符總個(gè)數(shù)M小于基本考察單元個(gè)數(shù)K,即M<K時(shí),所述方法還包括:
判斷所述簡(jiǎn)譜是否結(jié)束,如果未結(jié)束,將所示簡(jiǎn)譜中后一個(gè)子片段與當(dāng)前的子片段聯(lián)合,與基本考察單元進(jìn)行對(duì)應(yīng);
若判斷所述簡(jiǎn)譜結(jié)束,將當(dāng)前音符子片段中的音符與基本考察單元一一對(duì)應(yīng)后刪除未對(duì)應(yīng)上的基本考察單元。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)簡(jiǎn)譜中各音符的音高,和所述對(duì)應(yīng)關(guān)系,確定其所對(duì)應(yīng)的基本考察單元的目標(biāo)基頻值,包括:
根據(jù)公式F0_rule=440*2(p-69)/12,計(jì)算所述音符音高對(duì)應(yīng)的目標(biāo)基頻值,作為對(duì)應(yīng)的基本考察單元的目標(biāo)基頻值;其中F0_rule為目標(biāo)基頻值,440表示中央C上A音符發(fā)出的頻率,p為當(dāng)前簡(jiǎn)譜中標(biāo)注的音高與中央C上A 音符的距離。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于科大訊飛股份有限公司,未經(jīng)科大訊飛股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210591777.0/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 基于語音轉(zhuǎn)換的情感語音生成方法
- 用于語者調(diào)適的基頻移動(dòng)量學(xué)習(xí)裝置、基頻生成裝置、移動(dòng)量學(xué)習(xí)方法、基頻生成方法及移動(dòng)量學(xué)習(xí)程序
- 一種用于參數(shù)化語音合成的基頻建模方法
- 一種音頻數(shù)據(jù)處理方法、裝置及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 聲學(xué)特征的確定方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種歌聲合成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 歌曲生成方法、裝置、可讀介質(zhì)及電子設(shè)備
- 音頻處理方法及裝置
- 一種數(shù)據(jù)處理方法以及設(shè)備
- 基頻獲取方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 控制遠(yuǎn)程服務(wù)調(diào)用頻率的方法和裝置
- 時(shí)長(zhǎng)記錄方法、藍(lán)牙從設(shè)備與時(shí)長(zhǎng)記錄系統(tǒng)
- 音素時(shí)長(zhǎng)預(yù)測(cè)建模方法及音素時(shí)長(zhǎng)預(yù)測(cè)方法
- 時(shí)長(zhǎng)顯示方法和時(shí)長(zhǎng)顯示裝置
- 預(yù)估接駕時(shí)長(zhǎng)方法及預(yù)估接駕時(shí)長(zhǎng)系統(tǒng)
- 一種監(jiān)控學(xué)生學(xué)習(xí)進(jìn)度的方法及終端
- 一種可根據(jù)不同人群調(diào)節(jié)交通信號(hào)燈時(shí)長(zhǎng)的系統(tǒng)
- 運(yùn)動(dòng)時(shí)長(zhǎng)測(cè)試器
- 配送時(shí)長(zhǎng)獲取、配送時(shí)長(zhǎng)預(yù)測(cè)模型生成的方法、裝置
- 物流運(yùn)單時(shí)效推送方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)





