[發明專利]一種歌唱合成方法、裝置、電子設備及存儲介質在審
| 申請號: | 202011384883.2 | 申請日: | 2020-11-30 |
| 公開(公告)號: | CN112562633A | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | 顧宇 | 申請(專利權)人: | 北京有竹居網絡技術有限公司 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02 |
| 代理公司: | 北京遠智匯知識產權代理有限公司 11659 | 代理人: | 范坤坤 |
| 地址: | 101299 北京市平*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 歌唱 合成 方法 裝置 電子設備 存儲 介質 | ||
本申請公開了一種歌唱合成方法、裝置、電子設備及存儲介質。方法包括:獲取待合成的歌曲信息,其中,待合成的歌曲信息中包括歌詞文本和旋律信息;根據待合成的歌曲信息獲得梅爾濾波器組特征和實際基頻信息;根據梅爾濾波器組特征和實際基頻信息獲得聲音波形,并根據聲音波形獲得合成歌曲。通過待合成的歌曲信息獲得梅爾濾波器組特征與實際基頻信息,并將梅爾濾波器組特征與基頻信息進行結合來獲得聲音波形,以根據聲音波形獲得合成歌曲,從而在歌唱合成中考慮了基頻信息的因素,保證了合成歌曲的音準質量,從而滿足了用戶的歌唱合成需求。
技術領域
本公開實施例涉及數據處理技術領域,尤其涉及一種歌唱合成方法、裝置、電子設備及存儲介質。
背景技術
語音合成,又稱文本轉換(Text To Speech,TTS)技術,能夠將文本轉換成語音,即將文字信息轉化為可聽的聲音信息,涉及聲學、語音學、數字信號處理以及計算機科學。
目前在進行歌唱語音合成時,通常采用的是端到端的語音合成系統,因此在通過語音合成系統進行歌唱合成的過程中,通常會存在音高不準的情況,從而影響合成歌曲的質量,并降低用戶的體驗效果。
發明內容
本公開實施例提供了一種歌唱合成方法、裝置、電子設備及存儲介質,以獲取音準質量較高的合成歌曲。
第一方面,本公開實施例提供了一種歌唱合成方法,該方法包括:
獲取待合成的歌曲信息,其中,待合成的歌曲信息中包括歌詞文本和旋律信息;
根據待合成的歌曲信息獲得梅爾濾波器組特征和實際基頻信息;
根據梅爾濾波器組特征和實際基頻信息獲得聲音波形,并根據聲音波形獲得合成歌曲。
第二方面,本公開實施例還提供了一種歌唱合成裝置,該裝置包括:
待合成的歌曲信息獲取模塊,用于獲取待合成的歌曲信息,其中,待合成的歌曲信息中包括歌詞文本和旋律信息;
梅爾濾波器組特征和實際基頻信息獲取模塊,用于根據待合成的歌曲信息獲得梅爾濾波器組特征和實際基頻信息;
歌唱合成模塊,用于根據梅爾濾波器組特征和實際基頻信息獲得聲音波形,并根據聲音波形獲得合成歌曲。
第三方面,本公開實施例還提供了一種電子設備,該電子設備包括:
一個或多個處理器;
存儲裝置,用于存儲一個或多個程序,
當一個或多個程序被一個或多個處理器執行,使得一個或多個處理器實現如本公開任意實施例的方法。
第四方面,本公開實施例提供了一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執行時實現如本公開任意實施例的方法。
本公開實施例中,通過待合成的歌曲信息獲得梅爾濾波器組特征與實際基頻信息,并將梅爾濾波器組特征與基頻信息進行結合來獲得聲音波形,以根據聲音波形獲得合成歌曲,從而在歌唱合成中考慮了基頻信息的因素,保證了合成歌曲的音準質量,從而滿足了用戶的歌唱合成需求。
附圖說明
結合附圖并參考以下具體實施方式,本公開各實施例的上述和其他特征、優點及方面將變得更加明顯。貫穿附圖中,相同或相似的附圖標記表示相同或相似的元素。應當理解附圖是示意性的,原件和元素不一定按照比例繪制。
圖1(a)是本公開實施例提供的一種歌唱合成方法的流程圖;
圖1(b)是本公開實施例所提供的旋律信息的示意圖;
圖1(c)是本公開實施例所提供的聲音波形的示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京有竹居網絡技術有限公司,未經北京有竹居網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011384883.2/2.html,轉載請聲明來源鉆瓜專利網。





