[發明專利]一種翻唱識別方法、裝置及計算機存儲介質有效
| 申請號: | 202010226722.4 | 申請日: | 2020-03-26 |
| 公開(公告)號: | CN111445923B | 公開(公告)日: | 2023-09-19 |
| 發明(設計)人: | 孔令城 | 申請(專利權)人: | 騰訊音樂娛樂科技(深圳)有限公司 |
| 主分類號: | G10L25/03 | 分類號: | G10L25/03;G10L25/18;G10L25/51;G06F16/635;G06F16/683 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 熊永強;杜維 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 翻唱 識別 方法 裝置 計算機 存儲 介質 | ||
本申請提供了一種翻唱識別方法及裝置,方法包括:獲取第一音頻及第一音頻的頻譜圖、第二音頻及第二音頻的頻譜圖,其中,第一音頻的頻譜圖是對第一音頻進行信號處理得到的,第二音頻的頻譜圖是對第二音頻進行信號處理得到的;根據第一音頻的頻譜圖,得到第一音頻的節拍位置,再根據第一音頻的節拍位置得到第一音頻的每分鐘節拍數BPM;根據第二音頻的頻譜圖,得到第二音頻的節拍位置,再根據第二音頻的節拍位置得到第二音頻的BPM;在第一音頻的BPM與第二音頻的BPM的m倍的差值小于第一預設閾值的情況下,第二音頻與第一音頻互為翻唱音頻,其中,m是正整數。
技術領域
本申請涉及人工智能領域,尤其涉及一種翻唱識別方法、裝置及計算機存儲介質。
背景技術
翻唱是指將歌手將已經發表并由他人演唱的歌曲,根據自己的風格重新演唱的一種行為,包括重新填詞、重新編曲等等。顧名思義,翻唱識別就是識別出與原唱歌曲在歌詞、編曲上類似的歌曲,其目的主要是在海量的音樂信息中找到同源音樂的不同版本。
目前,通常根據音頻的和聲音級輪廓(Harmonic?Pitch?Class?Profile,HPCP)特征來判斷兩段音頻互為翻唱歌曲的概率,但是,HPCP特征中混合了大量的干擾信息,導致翻唱識別的精度低下。因此如何提高翻唱歌曲的識別準確度仍然是一個亟需解決的問題。
發明內容
本申請實施例公開了一種翻唱識別方法及裝置,能夠有效地提高翻唱歌曲識別的準確率。
第一方面,本申請提供了一種翻唱識別的方法,方法包括:
獲取第一音頻及第一音頻的頻譜圖、第二音頻及第二音頻的頻譜圖,其中,第一音頻的頻譜圖是對第一音頻進行信號處理得到的,第二音頻的頻譜圖是對第二音頻進行信號處理得到的;
根據第一音頻的頻譜圖,得到第一音頻的節拍位置,再根據第一音頻的節拍位置得到第一音頻的每分鐘節拍數(Beat?Per?Minute,BPM);
根據第二音頻的頻譜圖,得到第二音頻的節拍位置,再根據第二音頻的節拍位置得到第二音頻的BPM;
在第一音頻的BPM與第二音頻的BPM的m倍的差值小于第一預設閾值的情況下,第二音頻與第一音頻互為翻唱音頻,其中,m是正整數。
在一些可能的設計中,獲取第一音頻和第二音頻包括:
接收用戶輸入的翻唱識別請求,其中,翻唱識別請求中包括第一音頻;根據第一音頻,在曲庫中確定與第一音頻對應的候選翻唱合集,其中,第二音頻屬于候選翻唱合集。
在一些可能的設計中,曲庫中包括音頻A1,A2,…,An,根據第一音頻,其中,n是正整數,在樂曲庫中確定與第一音頻對應的候選翻唱合集包括:
分別提取第一音頻的HPCP特征以及音頻A1,A2,...,An的HPCP特征,得到特征向量V0,V1,V2,...,Vn,其中,特征向量V0是第一音頻的HPCP特征,特征向量V1,V2,...,Vn分別是音頻A1,A2,...,An的HPCP特征,特征向量V1,V2,...,Vn與音頻A1,A2,...,An一一對應;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊音樂娛樂科技(深圳)有限公司,未經騰訊音樂娛樂科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010226722.4/2.html,轉載請聲明來源鉆瓜專利網。





