[發明專利]音頻樣本生成方法、裝置、計算機設備及存儲介質有效
| 申請號: | 202010199777.0 | 申請日: | 2020-03-20 |
| 公開(公告)號: | CN111428074B | 公開(公告)日: | 2023-08-08 |
| 發明(設計)人: | 繆暢宇 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/635 | 分類號: | G06F16/635;G06F16/65;G06F18/214;G06F18/23 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 祝亞男 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 樣本 生成 方法 裝置 計算機 設備 存儲 介質 | ||
本申請公開了一種音頻樣本生成方法、裝置、計算機設備及存儲介質,涉及音頻技術領域。該方法包括:根據音頻屬性特征對音頻庫中的音頻進行聚類,得到音頻類簇,音頻屬性特征包括至少兩個不同維度的屬性特征;根據音頻類簇中的音頻生成候選音頻對,候選音頻對中包含兩段音頻;根據音頻庫中音頻的歷史播放記錄,確定候選音頻對中的音頻正樣本對和音頻負樣本對,音頻正樣本對中的音頻屬于同一音頻類簇,音頻負樣本對中的音頻屬于不同音頻類簇。通過融合音頻多維度的屬性特征進行聚類,并基于用戶的音頻播放記錄篩選正負樣本對,使生成音頻樣本對能夠從多角度反映音頻之間的相似性,在實現自動生成音頻樣本對的同時,提高了生成的音頻樣本對的質量。
技術領域
本申請實施例涉及音頻技術領域,特別涉及一種音頻樣本生成方法、裝置、計算機設備及存儲介質。
背景技術
音樂推薦是音頻播放應用程序中的常用功能,能夠根據用戶的喜好向用戶推薦音樂。
在一種實現音樂推薦的方式中,音頻播放應用程序的后臺服務器通過音頻匹配模型,對曲庫中的音樂進行匹配,從而確定出匹配程度較高的音樂,進而根據匹配結果進行音樂推薦。在使用音頻匹配模型進行音頻匹配之前,需要使用音頻樣本進行模型訓練,而模型訓練質量與音頻樣本密切相關。
相關技術中,通過常用人工標注的方式生成音頻樣本,即由專門人員確定出相似度較高的音樂,以及相似度較低的音樂。然而,采用上述方式生成的音頻樣本的效率較低,且質量較差(過于主觀),進而導致模型訓練質量較差,影響后續利用音頻匹配模型進行音頻匹配的準確性。
發明內容
本申請實施例提供了一種音頻樣本生成方法、裝置、計算機設備及存儲介質,可以提高音頻樣本的生成效率以及質量,從而提高利用音頻樣本訓練得到的模型的質量。所述技術方案如下:
一方面,本申請實施例提供了一種音頻樣本生成方法,所述方法包括:
根據音頻屬性特征對音頻庫中的音頻進行聚類,得到音頻類簇,所述音頻屬性特征包括至少兩個不同維度的屬性特征,且不同音頻類簇中音頻的特征相似度低于同一音頻類簇中音頻的特征相似度;
根據所述音頻類簇中的音頻生成候選音頻對,所述候選音頻對中包含兩段音頻,且所述兩段音頻屬于同一音頻類簇或不同音頻類簇;
根據所述音頻庫中音頻的歷史播放記錄,確定所述候選音頻對中的音頻正樣本對和音頻負樣本對,其中,所述音頻正樣本對中的音頻屬于同一音頻類簇,所述音頻負樣本對中的音頻屬于不同音頻類簇。
另一方面,本申請實施例提供了一種音頻樣本生成裝置,所述裝置包括:
聚類模塊,用于根據音頻屬性特征對音頻庫中的音頻進行聚類,得到音頻類簇,所述音頻屬性特征包括至少兩個不同維度的屬性特征,且不同音頻類簇中音頻的特征相似度低于同一音頻類簇中音頻的特征相似度;
生成模塊,用于根據所述音頻類簇中的音頻生成候選音頻對,所述候選音頻對中包含兩段音頻,且所述兩段音頻屬于同一音頻類簇或不同音頻類簇;
確定模塊,用于根據所述音頻庫中音頻的歷史播放記錄,確定所述候選音頻對中的音頻正樣本對和音頻負樣本對,其中,所述音頻正樣本對中的音頻屬于同一音頻類簇,所述音頻負樣本對中的音頻屬于不同音頻類簇。
另一方面,本申請實施例提供了一種計算機設備,所述計算機設備包括處理器和存儲器,所述存儲器中存儲有至少一條指令、至少一段程序、代碼集或指令集,所述至少一條指令、所述至少一段程序、所述代碼集或指令集由所述處理器加載并執行以實現如上述方面所述的音頻樣本生成方法。
另一方面,提供了一種計算機可讀存儲介質,所述可讀存儲介質中存儲有至少一條指令、至少一段程序、代碼集或指令集,所述至少一條指令、所述至少一段程序、所述代碼集或指令集由處理器加載并執行以實現如上述方面所述的音頻樣本生成方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010199777.0/2.html,轉載請聲明來源鉆瓜專利網。





