[發(fā)明專利]評(píng)價(jià)語音信號(hào)的方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201810552906.2 | 申請(qǐng)日: | 2018-05-31 |
| 公開(公告)號(hào): | CN108877835A | 公開(公告)日: | 2018-11-23 |
| 發(fā)明(設(shè)計(jì))人: | 周武高;鐘虎林;王洪亮;羅均文 | 申請(qǐng)(專利權(quán))人: | 深圳市路通網(wǎng)絡(luò)技術(shù)有限公司 |
| 主分類號(hào): | G10L25/48 | 分類號(hào): | G10L25/48;G10L25/51 |
| 代理公司: | 深圳市深佳知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518057 廣東省深圳市南山區(qū)科豐路2號(hào)*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 評(píng)價(jià)語音信號(hào) 語音信號(hào) 便捷性 歌曲 | ||
1.評(píng)價(jià)語音信號(hào)的方法,其特征在于,包括:
獲取原唱歌曲的語音信號(hào);
識(shí)別出所述語音信號(hào)對(duì)應(yīng)的唱詞;
根據(jù)原唱歌曲的唱詞,對(duì)實(shí)時(shí)輸入的第一語音信號(hào)進(jìn)行評(píng)價(jià),所述第一語音信號(hào)用于演唱對(duì)應(yīng)的原唱歌曲。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述識(shí)別出所述語音信號(hào)對(duì)應(yīng)的唱詞,包括:
對(duì)所述語音信號(hào)進(jìn)行預(yù)處理和特征提取,提取出所述語音信號(hào)對(duì)應(yīng)的聲學(xué)特征;
將所述聲學(xué)特征輸入聲學(xué)模型和語言模型,得到聲學(xué)識(shí)別結(jié)果和語言識(shí)別結(jié)果;
根據(jù)所述聲學(xué)識(shí)別結(jié)果和所述語音識(shí)別結(jié)果,輸出所述語音信號(hào)對(duì)應(yīng)的唱詞。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述獲取原唱歌曲的語音信號(hào)之后,所述方法還包括:
將所述語音信號(hào)轉(zhuǎn)換為對(duì)應(yīng)的音高序列;
所述根據(jù)原唱歌曲的唱詞,對(duì)實(shí)時(shí)輸入的第一語音信號(hào)進(jìn)行評(píng)價(jià),包括:
根據(jù)原唱歌曲的音高序列和唱詞,對(duì)實(shí)時(shí)輸入的第一語音信號(hào)進(jìn)行評(píng)價(jià)。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述將所述語音信號(hào)轉(zhuǎn)換為對(duì)應(yīng)的音高序列,包括:
對(duì)所述語音信號(hào)做分幀加窗處理,得到每幀語音信號(hào)的時(shí)域圖譜;
依次對(duì)每幀語音信號(hào)的時(shí)域圖譜做快速傅里葉變換,得到每幀語音信號(hào)的頻域圖譜;
依次確定每個(gè)頻域圖譜中的基頻,并將所述基頻轉(zhuǎn)換為對(duì)應(yīng)的音高,得到原唱歌曲的音高序列。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,在所述識(shí)別出所述語音信號(hào)對(duì)應(yīng)的唱詞之后,所述方法還包括:
依照過零率對(duì)所述語音信號(hào)進(jìn)行端點(diǎn)檢測(cè),以識(shí)別出所述語音信號(hào)中的多個(gè)起點(diǎn)和終點(diǎn);
根據(jù)對(duì)應(yīng)的起點(diǎn)和終點(diǎn),對(duì)所述原唱歌曲的音高序列和唱詞進(jìn)行切分,得到對(duì)應(yīng)的多個(gè)第一音高片段和多個(gè)第一唱詞片段;
根據(jù)所述多個(gè)第一音高片段和多個(gè)第一唱詞片段,構(gòu)建原唱歌曲的切分網(wǎng)絡(luò)。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述根據(jù)原唱歌曲的音高序列和唱詞,對(duì)實(shí)時(shí)輸入的第一語音信號(hào)進(jìn)行評(píng)價(jià),包括:
獲取所述第一語音信號(hào)的音高序列和所述第一語音信號(hào)對(duì)應(yīng)的唱詞;
根據(jù)所述切分網(wǎng)絡(luò),對(duì)所述第一語音信號(hào)進(jìn)行切分,得到所述第一語音信號(hào)對(duì)應(yīng)的多個(gè)第二音高片段和多個(gè)第二唱詞片段;
將所述第二音高片段和所述第二唱詞片段分別與對(duì)應(yīng)的所述第一音高片段和所述第一唱詞片段進(jìn)行對(duì)比;
根據(jù)對(duì)比結(jié)果,對(duì)實(shí)時(shí)輸入的第一語音信號(hào)進(jìn)行評(píng)價(jià)。
7.根據(jù)權(quán)利要求5或6所述的方法,其特征在于,所述依照過零率對(duì)所述語音信號(hào)進(jìn)行端點(diǎn)檢測(cè),以識(shí)別出所述語音信號(hào)中的多個(gè)起點(diǎn)和終點(diǎn),包括:
統(tǒng)計(jì)當(dāng)前幀中語音信號(hào)的過零率,并計(jì)算當(dāng)前幀中語音信號(hào)的幅度和;
判斷所述過零率和所述幅度和,是否至少有一個(gè)大于對(duì)應(yīng)的預(yù)設(shè)閾值;
若所述過零率和所述幅度和中的至少一個(gè)大于對(duì)應(yīng)的預(yù)設(shè)閾值時(shí),則判斷當(dāng)前幀的持續(xù)時(shí)長是否大于第一預(yù)設(shè)時(shí)長;
若大于所述第一預(yù)設(shè)時(shí)長,則確定所述當(dāng)前幀為起點(diǎn);
若所述過零率和所述幅度和都不大于對(duì)應(yīng)的預(yù)設(shè)閾值時(shí),則判斷當(dāng)前幀的持續(xù)時(shí)長是否大于第二預(yù)設(shè)時(shí)長;
若大于所述第二預(yù)設(shè)時(shí)長,則確定所述當(dāng)前幀為終點(diǎn)。
8.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述在將所述聲學(xué)特征輸入聲學(xué)模型和語言模型之前,所述方法還包括:
提取原唱歌曲的語音數(shù)據(jù),及所述語音數(shù)據(jù)中與所述聲學(xué)模型建模單元相匹配的語音特征;
統(tǒng)計(jì)所述語音特征與所述聲學(xué)模型之間的似然度;
將所述似然度通過MLLR基于詞網(wǎng)的最大似然線性回歸無監(jiān)督自適應(yīng)算法,應(yīng)用于所述聲學(xué)模型,以更新所述聲學(xué)模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市路通網(wǎng)絡(luò)技術(shù)有限公司,未經(jīng)深圳市路通網(wǎng)絡(luò)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810552906.2/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 語音操控系統(tǒng)的評(píng)價(jià)系統(tǒng)及方法
- 檢測(cè)通話斷續(xù)的方法和裝置
- 回聲消除的測(cè)試方法、裝置及測(cè)試設(shè)備
- 一種語音質(zhì)量評(píng)價(jià)方法及裝置
- 評(píng)價(jià)語音信號(hào)的方法及系統(tǒng)
- 語音識(shí)別方法、裝置、設(shè)備和系統(tǒng)
- 一種基于聲音特征的自主神經(jīng)功能參數(shù)獲取方法
- 一種語音質(zhì)量的評(píng)價(jià)方法及裝置
- 聲學(xué)回聲消除算法的評(píng)估方法、裝置及終端設(shè)備
- 聲學(xué)回聲消除算法的評(píng)估方法、裝置及終端設(shè)備
- 信息處理設(shè)備、方法和記錄媒體
- 語音信號(hào)處理電路和裝置
- 一種判斷說話人數(shù)目的方法及系統(tǒng)
- 基于人工智能的語音信號(hào)處理方法、裝置及存儲(chǔ)介質(zhì)
- 環(huán)境語音采集處理方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 語音識(shí)別方法、裝置、電子設(shè)備以及存儲(chǔ)介質(zhì)
- 語音信號(hào)的處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 語音信號(hào)處理方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種語音信號(hào)處理方法、裝置、介質(zhì)和設(shè)備
- 一種雙路語音同傳的收發(fā)系統(tǒng)





