[發明專利]歌曲多媒體的合成方法、裝置、電子設備及存儲介質在審
| 申請號: | 202011164612.6 | 申請日: | 2020-10-27 |
| 公開(公告)號: | CN112331234A | 公開(公告)日: | 2021-02-05 |
| 發明(設計)人: | 吳思遠;李超;孫晨曦 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G11B27/031 | 分類號: | G11B27/031 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 王萌 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 歌曲 多媒體 合成 方法 裝置 電子設備 存儲 介質 | ||
本申請公開了歌曲多媒體的合成方法、裝置、電子設備及存儲介質,涉及語音技術、深度學習技術領域。具體實現方案為:響應于歌曲多媒體合成請求,顯示素材獲取模式;獲取用戶通過所選擇的素材獲取模式提供的用戶音頻;將用戶音頻輸入音色提取模型,以得到音色提取模型輸出的用戶音色;獲取用戶通過所選擇的素材獲取模式提供的待合成的歌詞以及待合成的曲譜,并將用戶音色、待合成的歌詞以及待合成的曲譜輸入歌曲合成模型,以得到合成后的歌曲多媒體,從而擴展了用戶提供各種素材的方式,方便用戶根據自身條件提供各種素材,減少了用戶生成帶自己音色的歌曲多媒體所需要進行的操作等,降低了歌曲多媒體的合成成本,提高了歌曲多媒體的合成效率。
技術領域
本申請涉及計算機技術領域,具體涉及語音技術、深度學習技術領域,尤其涉及歌曲多媒體的合成方法、裝置、電子設備及存儲介質。
背景技術
相關技術中,音樂合成方法主要為,獲取用戶所提供的說話素材,結合曲譜對用戶所提供的說話素材進行剪輯以及聲調處理等,生成該用戶的唱歌效果。
然而,上述方法中,需要人員花費大量的時間去進行手動剪輯以及手動聲調處理操作,例如一周到半個月,剪輯時間長,成本高,且剪輯得到的唱歌效果較差。
發明內容
本公開提供了一種歌曲多媒體的合成方法、裝置、電子設備以及存儲介質。
根據本公開的一方面,提供了一種歌曲多媒體的合成方法,包括:響應于歌曲多媒體合成請求,顯示素材獲取模式;獲取用戶通過所選擇的素材獲取模式提供的用戶音頻;將所述用戶音頻輸入音色提取模型,以得到所述音色提取模型輸出的用戶音色;獲取用戶通過所選擇的素材獲取模式提供的待合成的歌詞以及待合成的曲譜,并將所述用戶音色、所述待合成的歌詞以及所述待合成的曲譜輸入歌曲合成模型,以得到合成后的歌曲多媒體。
根據本公開的另一方面,提供了一種歌曲多媒體的合成裝置,包括:顯示模塊,用于響應于歌曲多媒體合成請求,顯示素材獲取模式;第一獲取模塊,用于獲取用戶通過所選擇的素材獲取模式提供的用戶音頻;音色提取模塊,用于將所述用戶音頻輸入音色提取模型,以得到所述音色提取模型輸出的用戶音色;合成模塊,用于獲取用戶通過所選擇的素材獲取模式提供的待合成的歌詞以及待合成的曲譜,并將所述用戶音色、所述待合成的歌詞以及所述待合成的曲譜輸入歌曲合成模型,以得到合成后的歌曲多媒體。
根據第三方面,提供了一種電子設備,包括:至少一個處理器;以及與所述至少一個處理器通信連接的存儲器;其中,所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行如上所述的歌曲多媒體的合成方法。
根據第四方面,提出了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,所述計算機指令用于使所述計算機執行如上所述的歌曲多媒體的合成方法。
應當理解,本部分所描述的內容并非旨在標識本公開的實施例的關鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
附圖說明
附圖用于更好地理解本方案,不構成對本申請的限定。其中:
圖1是根據本申請第一實施例的示意圖;
圖2是根據本申請第二實施例的示意圖;
圖3是根據本申請第三實施例的示意圖;
圖4是根據本申請第四實施例的示意圖;
圖5是用來實現本申請實施例的歌曲多媒體的合成方法的電子設備的框圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011164612.6/2.html,轉載請聲明來源鉆瓜專利網。





