[發明專利]神經網絡模型訓練方法、音頻配樂方法及相關設備在審
| 申請號: | 202211699711.3 | 申請日: | 2022-12-28 |
| 公開(公告)號: | CN116013358A | 公開(公告)日: | 2023-04-25 |
| 發明(設計)人: | 王武城 | 申請(專利權)人: | 騰訊音樂娛樂科技(深圳)有限公司 |
| 主分類號: | G10L25/30 | 分類號: | G10L25/30;G10L25/51 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 張金香 |
| 地址: | 518052 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 神經網絡 模型 訓練 方法 音頻 配樂 相關 設備 | ||
本申請實施例公開了一種神經網絡模型訓練方法、音頻配樂方法及相關設備。模型根據音頻樣本的融合特征向量獲得音頻樣本的深度特征,根據背景音樂樣本的融合特征向量獲得背景音樂樣本的深度特征,將音頻樣本與背景音樂樣本各自的深度特征拼接得到深度融合特征,對深度融合特征計算得到預測標簽,根據預測標簽和真實標簽調整模型參數,直至滿足收斂條件時停止模型訓練。由于模型對多種不同適配程度的音頻樣本和背景音樂樣本進行訓練,因而在模型應用時能夠放大音頻與背景音樂之間特征的適配性,使得相適配的音頻與背景音樂在特征上更加接近,而不相適配的音頻與背景音樂在特征上更加遠離,更便于用戶判斷背景音樂是否適配音頻,提升音頻配樂的效率。
技術領域
本申請實施例涉及音頻處理領域,具體涉及一種神經網絡模型訓練方法、音頻配樂方法及相關設備。
背景技術
隨著時代的發展,人們逐漸擺脫書籍的閱讀,特別是對于熱愛小說的人們而言,由于閱讀小說需要花費大量時間,而為了在生活間隙保持自己的愛好,人們會選擇聽書。在開車、在短暫的午休時光等,長音頻都是用戶的優質選擇。長音頻包含故事、小說、相聲、訪談等等,形式豐富多樣,深受用戶喜愛。而對于一段長音頻而言,配樂是吸引聽眾、輔助表達的重要因素。雖然人聲是長音頻的主要內容,但配樂往往是完善描述場景、給人以想象空間的重要指導。給長音頻配上合適的背景音樂,能讓音頻內容更加豐富多彩,也能讓聽眾更加投入、身臨其境。目前大多數長音頻都是人工添加配樂,或者給予一定的背景音樂選擇,讓用戶自主選擇背景音樂以進行配樂。
現有的長音頻配樂往往由專業的制作人員根據長音頻內容、意境進行選擇,或者提供一定類別的背景音樂供用戶選擇。無論是哪種方案,都需要人工參與,且配樂結果比較主觀,即某個聽眾喜歡的長音頻的配樂結果,其他聽眾并不一定喜歡。并且,無論是從海量的背景音樂中選擇自己喜歡的背景音樂,或者是對大量的長音頻作品進行配樂,都是十分耗費時間的,導致人工配樂效率緩慢。
發明內容
本申請實施例提供了一種神經網絡模型訓練方法、音頻配樂方法及相關設備,可用于制作適配性更佳的音頻配樂作品。
本申請實施例第一方面提供了一種神經網絡模型訓練方法,所述方法應用于計算機設備,所述方法包括:
獲取多組訓練樣本,每組所述訓練樣本包括音頻樣本的多個維度特征對應的融合特征向量和背景音樂樣本的多個維度特征對應的融合特征向量,以及用于表示所述音頻樣本和所述背景音樂樣本之間的適配程度的真實標簽;
獲取初始神經網絡模型,所述初始神經網絡模型包括卷積結構、與所述卷積結構連接的全連接層以及與所述全連接層連接的sigmoid層;
將每組所述訓練樣本輸入至所述初始神經網絡模型,以使得所述初始神經網絡模型執行以下操作:
使用所述卷積結構對所述音頻樣本的融合特征向量進行特征提取得到所述音頻樣本的深度特征,以及對所述背景音樂樣本的融合特征向量進行特征提取得到所述背景音樂樣本的深度特征;
使用所述全連接層將所述音頻樣本的深度特征與所述背景音樂樣本的深度特征進行拼接得到深度融合特征;
使用所述sigmoid層對所述深度融合特征計算得到預測標簽;
根據所述真實標簽和所述預測標簽構建損失函數,根據所述損失函數的損失值調整所述初始神經網絡模型的模型參數,直至所述損失函數滿足收斂條件時停止訓練,得到目標神經網絡模型。
本申請實施例第二方面提供了一種音頻配樂方法,所述方法應用于計算機設備,所述方法包括:
獲取待配樂的目標音頻的多個維度特征對應的融合特征向量,以及,獲取每一首備選背景音樂的多個維度特征對應的融合特征向量;
將所述目標音頻的融合特征向量輸入至預先訓練完成的目標神經網絡模型,得到所述目標神經網絡模型輸出的音頻特征向量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊音樂娛樂科技(深圳)有限公司,未經騰訊音樂娛樂科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211699711.3/2.html,轉載請聲明來源鉆瓜專利網。





