[發(fā)明專利]一種翻唱識別方法、裝置及計算機存儲介質有效
| 申請?zhí)枺?/td> | 202010226722.4 | 申請日: | 2020-03-26 |
| 公開(公告)號: | CN111445923B | 公開(公告)日: | 2023-09-19 |
| 發(fā)明(設計)人: | 孔令城 | 申請(專利權)人: | 騰訊音樂娛樂科技(深圳)有限公司 |
| 主分類號: | G10L25/03 | 分類號: | G10L25/03;G10L25/18;G10L25/51;G06F16/635;G06F16/683 |
| 代理公司: | 廣州三環(huán)專利商標代理有限公司 44202 | 代理人: | 熊永強;杜維 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 翻唱 識別 方法 裝置 計算機 存儲 介質 | ||
1.一種翻唱識別方法,其特征在于,包括:
獲取第一音頻及所述第一音頻的頻譜圖、第二音頻及所述第二音頻的頻譜圖,其中,所述第一音頻的和聲音級輪廓HPCP特征和所述第二音頻的HPCP特征的相似度大于相似度預設閾值,所述第一音頻的頻譜圖是對所述第一音頻進行信號處理得到的,所述第二音頻的頻譜圖是對所述第二音頻進行信號處理得到的;
根據(jù)所述第一音頻的頻譜圖,得到所述第一音頻的節(jié)拍位置,再根據(jù)所述第一音頻的節(jié)拍位置得到所述第一音頻的每分鐘節(jié)拍數(shù)BPM;
根據(jù)所述第二音頻的頻譜圖,得到所述第二音頻的節(jié)拍位置,再根據(jù)所述第二音頻的節(jié)拍位置得到所述第二音頻的BPM;
在m倍頻的情況下,如果所述第一音頻的BPM與所述第二音頻的BPM的m倍的差值小于第一預設閾值,則所述第二音頻與所述第一音頻互為翻唱音頻,其中,m是正整數(shù)。
2.根據(jù)權利要求1所述的方法,其特征在于,所述獲取第一音頻和第二音頻包括:
接收用戶輸入的翻唱識別請求,其中,所述翻唱識別請求中包括所述第一音頻;
根據(jù)所述第一音頻,在曲庫中確定與所述第一音頻對應的候選翻唱合集,其中,所述第二音頻屬于所述候選翻唱合集。
3.根據(jù)權利要求2所述的方法,其特征在于,所述曲庫中包括音頻A1,A2,...,An,其中,n是正整數(shù),所述根據(jù)所述第一音頻,在樂曲庫中確定與所述第一音頻對應的候選翻唱合集包括:
分別提取所述第一音頻的和聲音級輪廓HPCP特征以及所述音頻A1,A2,...,An的HPCP特征,得到特征向量V0,V1,V2,...,Vn,其中,所述特征向量V0是所述第一音頻的HPCP特征,所述特征向量V1,V2,...,Vn分別是所述音頻A1,A2,...,An的HPCP特征,所述特征向量V1,V2,...,Vn與所述音頻A1,A2,...,An一一對應;
確定所述特征向量V0與所述特征向量V1的相似度,得到所述第一音頻與所述音頻A1互為翻唱的概率P1,確定所述特征向量V0與所述特征向量V2的相似度,得到所述第一音頻與所述音頻A2互為翻唱的概率P2,…,確定所述特征向量V0與所述特征向量Vn的相似度,得到所述第一音頻與所述音頻An互為翻唱的概率Pn;
在所述概率P1大于第二預設閾值的情況下,將所述音頻A1存儲到所述候選翻唱合集,在所述概率P2大于所述第二預設閾值的情況下,將所述音頻A2存儲到所述候選翻唱合集,…,在所述概率Pn大于所述第二預設閾值的情況下,將所述音頻An存儲到所述候選翻唱合集。
4.根據(jù)權利要求1至3任一項權利要求所述的方法,其特征在于,所述第一音頻的BPM與所述第二音頻的BPM的m倍的差值小于第一預設閾值包括以下至少一個:
所述第一音頻的BPM與所述第二音頻的BPM的差值等于0,所述第一音頻的BPM與所述第二音頻的BPM的差值小于5,所述第一音頻的BPM與所述第二音頻的BPM的2倍的差值小于10,以及所述第一音頻的BPM與所述第二音頻的BPM的3倍的差值小于5。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊音樂娛樂科技(深圳)有限公司,未經騰訊音樂娛樂科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010226722.4/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





