[發明專利]音頻樣本生成方法、裝置、計算機設備及存儲介質有效
| 申請號: | 202010199777.0 | 申請日: | 2020-03-20 |
| 公開(公告)號: | CN111428074B | 公開(公告)日: | 2023-08-08 |
| 發明(設計)人: | 繆暢宇 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/635 | 分類號: | G06F16/635;G06F16/65;G06F18/214;G06F18/23 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 祝亞男 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 樣本 生成 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種音頻樣本生成方法,其特征在于,所述方法包括:
根據音頻屬性特征對音頻庫中的音頻進行聚類,得到音頻類簇,所述音頻屬性特征包括至少兩個不同維度的屬性特征,且不同音頻類簇中音頻的特征相似度低于同一音頻類簇中音頻的特征相似度;
根據同一音頻類簇中的音頻生成第一候選音頻對,并根據不同音頻類簇中的音頻生成第二候選音頻對;
獲取歷史播放記錄中的音頻播放序列,所述音頻播放序列用于表征用戶帳號下音頻的先后播放順序,且不同音頻播放序列對應不同用戶帳號;
對所述音頻播放序列進行劃分,得到音頻共現集合,所述音頻共現集合中包含至少兩段連續播放的音頻,且不同音頻共現集合中包含的音頻不同;
獲取所述第一候選音頻對在所述音頻共現集合中的第一共現次數;根據所述第一共現次數和所述音頻共現集合的集合數,確定所述第一候選音頻對的第一評分;根據所述第一評分的第一評分分布以及正樣本數量,確定第一評分區間,所述第一評分分布為所述第一評分的降序分布,且屬于所述第一評分區間的所述第一候選音頻對位于所述第一評分分布的前半部;將屬于所述第一評分區間的所述第一候選音頻對確定為音頻正樣本對;
獲取所述第二候選音頻對在所述音頻共現集合中的第二共現次數;根據所述第二共現次數和所述音頻共現集合的集合數,確定所述第二候選音頻對的第二評分;根據所述第二評分的第二評分分布以及負樣本數量,確定第二評分區間,所述第二評分分布為所述第二評分的升序分布,且屬于所述第二評分區間的所述第二候選音頻對位于所述第二評分分布的后半部;將屬于所述第二評分區間的所述第二候選音頻對確定為音頻負樣本對。
2.根據權利要求1所述的方法,其特征在于,所述根據音頻屬性特征對音頻庫中的音頻進行聚類,得到音頻類簇,包括:
獲取音頻的文本特征和音頻特征;
根據所述文本特征和所述音頻特征生成音頻特征向量;
根據所述音頻特征向量對所述音頻庫中的音頻進行聚類,得到所述音頻類簇。
3.根據權利要求2所述的方法,其特征在于,所述獲取音頻的文本特征和音頻特征,包括:
獲取音頻的文本數據,所述文本數據包括作曲者、作詞者、演唱者、音頻風格、音頻年代、演奏樂器、歌詞和評論中的至少一種;對所述文本數據進行向量化編碼處理,得到所述文本特征;
獲取音頻中預設音頻片段的音頻數據,所述預設音頻片段包括前奏片段、高潮片段和尾奏片段中的至少一種;對所述音頻數據進行向量化編碼處理,得到所述音頻特征。
4.根據權利要求1所述的方法,其特征在于,所述方法還包括:
根據所述音頻正樣本對和所述音頻負樣本對訓練音頻匹配模型,所述音頻匹配模型用于根據輸入音頻輸出音頻之間的匹配程度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010199777.0/1.html,轉載請聲明來源鉆瓜專利網。





