[發(fā)明專利]一種音頻信號(hào)相似程度的自動(dòng)檢測(cè)方法及其系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201810445754.6 | 申請(qǐng)日: | 2018-05-11 |
| 公開(公告)號(hào): | CN108665903B | 公開(公告)日: | 2021-04-30 |
| 發(fā)明(設(shè)計(jì))人: | 李偉;吳益明;陳軻 | 申請(qǐng)(專利權(quán))人: | 復(fù)旦大學(xué) |
| 主分類號(hào): | G10L19/02 | 分類號(hào): | G10L19/02;G10L25/51;G06F21/10 |
| 代理公司: | 上海正旦專利代理有限公司 31200 | 代理人: | 陸飛;陸尤 |
| 地址: | 200433 *** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 音頻 信號(hào) 相似 程度 自動(dòng)檢測(cè) 方法 及其 系統(tǒng) | ||
本發(fā)明公開了一種音頻信號(hào)相似程度的自動(dòng)檢測(cè)方法及其系統(tǒng),包括:獲取待檢測(cè)的兩段音頻信號(hào);對(duì)其進(jìn)行頻域分析并找出所有頻域能量局部峰值位置;連接頻域能量局部峰值,組成音高軌跡;根據(jù)頻域能量局部峰值位置,計(jì)算每個(gè)音頻幀的顯著值,得到顯著平均值;根據(jù)顯著平均值計(jì)算音高軌跡的有聲部分判斷的閾值;去除顯著平均值超出所述閾值的部分,得到兩段音頻信號(hào)的主旋律序列;求出兩段主旋律的相似性矩陣;并應(yīng)用動(dòng)態(tài)規(guī)劃局部規(guī)整算法做二值化處理,得到二值矩陣;進(jìn)而判斷兩段輸入音頻信號(hào)的相似程度。采用本發(fā)明的方法或系統(tǒng),提升了音頻信號(hào)相似程度檢測(cè)效率,解決了音頻傳播中的抄襲問題,對(duì)于數(shù)字音頻的版權(quán)管理問題予以了準(zhǔn)確全面的保護(hù)。
技術(shù)領(lǐng)域
本發(fā)明涉及音樂抄襲檢測(cè)領(lǐng)域,特別是一種音頻信號(hào)相似程度的自動(dòng)檢測(cè)方法及其系統(tǒng)。
背景技術(shù)
隨著互聯(lián)網(wǎng)以及軟件開發(fā)技術(shù)的高速發(fā)展,音樂傳播的代價(jià)以及音樂編寫的門檻變得越來(lái)越低,音頻相似性比較成了一個(gè)重要的研究課題。在音樂信息檢索的研究中,音樂相似性計(jì)算是其中一個(gè)關(guān)鍵的課題,它研究如何以計(jì)算方式衡量?jī)啥尾煌纛l的內(nèi)容上的相似性。音樂之間的“相似性”的定義通常包含著很大的主觀成分,然而其中也存在著一些可以量化的切入點(diǎn),比如旋律走向的相似程度,在音樂抄襲的判斷標(biāo)準(zhǔn)中,存在兩種說(shuō)法,一種是8小節(jié)以上的雷同便視為抄襲;另一種是相似音樂不超過(guò)4小節(jié)不算抄襲。無(wú)論是哪一種說(shuō)法,抄襲檢測(cè)主要依賴的技術(shù)無(wú)疑是音樂相似性的計(jì)算技術(shù)。音樂相似性計(jì)算中,基于片段的檢索(Query-by-example)的目標(biāo)是查詢音頻數(shù)據(jù)庫(kù)中的音頻以找出所有包含查詢片段(query clip)的音頻。這個(gè)問題在不同的應(yīng)用場(chǎng)合下,有不同的功能要求。在音頻識(shí)別(Audio identification)問題中,要求檢索系統(tǒng)在給定查詢片段之后,返回包含該片段的名稱或作曲家信息等。在一些場(chǎng)合,音頻識(shí)別問題還要求得出查詢片段在原音頻中的匹配位置。
在涉及到相似性計(jì)算方面的領(lǐng)域,有很多現(xiàn)有的方法,例如交叉相關(guān)(cross-correlation),弗羅貝尼烏斯范數(shù)(Frobenius norm),歐幾里得距離(Euclideandistance),以及點(diǎn)積等。例如現(xiàn)有技術(shù)中用于音樂抄襲檢測(cè)算法:基于動(dòng)態(tài)時(shí)間規(guī)整(Dynamic Time Warping)的算法,對(duì)于動(dòng)態(tài)規(guī)整算法的距離度量,通常采用的距離量度有歐幾里得距離、余弦距離與相關(guān)度等。然而,大量文獻(xiàn)指出,諸如Chroma向量等與聲調(diào)有關(guān)的向量并不適合放在歐幾里得空間中度量。動(dòng)態(tài)時(shí)間規(guī)整算法,就是把兩段不同長(zhǎng)度的音頻進(jìn)行時(shí)間上的“對(duì)齊”,例如,在語(yǔ)音識(shí)別中,不同人對(duì)于同一段話(或者說(shuō)字母)的發(fā)音時(shí)間必然長(zhǎng)短不一,但把該聲音記錄下來(lái)以后,它的信號(hào)肯定是很相似的,只是在時(shí)間上未對(duì)齊,所以動(dòng)態(tài)時(shí)間調(diào)整的目的是用一個(gè)函數(shù)拉長(zhǎng)或者縮短其中一個(gè)信號(hào),使得它們之間的誤差達(dá)到最小。在音樂相似度計(jì)算中,相似的音樂在時(shí)間長(zhǎng)短、旋律走向上必然存在一些誤差,但是如果說(shuō)兩首音樂是存在極大相似度的,那么這兩者間的相似信號(hào)必然存在很大的交集,因此,動(dòng)態(tài)時(shí)間規(guī)整算法被大量地運(yùn)用于音樂相似度計(jì)算之中,只要定義好音樂序列的距離計(jì)算方式,便可以根據(jù)動(dòng)態(tài)規(guī)劃計(jì)算累加距離,得到相似程度,對(duì)抄襲做出相關(guān)的判定。動(dòng)態(tài)規(guī)劃算法已經(jīng)給出了音頻的相似性。由于其應(yīng)對(duì)時(shí)長(zhǎng)變化的靈活性,大部分翻唱作品檢測(cè)算法都采用了基于動(dòng)態(tài)規(guī)劃算法的相似性計(jì)算方式,如最小編輯距離與動(dòng)態(tài)時(shí)間規(guī)整等。
然而,現(xiàn)有技術(shù)的主要問題是對(duì)于音樂抄襲的判斷效果并不全面。音樂抄襲更多只需要在音樂的局部進(jìn)行計(jì)算,動(dòng)態(tài)時(shí)間規(guī)整算法計(jì)算從(0,0)到(Am,Bm)之間的相似距離并不能很好地表現(xiàn)兩段音樂某個(gè)局部之間的相似度差異,因此在亂序的局部相似的音樂中,該方法并不能很好地顯示出顯著的相似度差異,如果要使用局部的截取進(jìn)行處理,那么無(wú)疑增加了時(shí)間的開銷,在快速判斷抄襲的技術(shù)需求下并不能作為首要選擇。同時(shí),對(duì)于序列距離的定義多種多樣,這種基于線性比較的方法在相似度計(jì)算中不存在明顯的梯度,換言之,相似度的擬合并不該是一條簡(jiǎn)單增長(zhǎng)的曲線,距離的定義一定程度上影響了判斷效果。
發(fā)明內(nèi)容
本發(fā)明的目的是提供了一種音頻信號(hào)相似程度的自動(dòng)檢測(cè)方法及其系統(tǒng),能對(duì)音頻中的短時(shí)相似片段進(jìn)行抄襲檢測(cè),準(zhǔn)確地體現(xiàn)出兩段音樂的局部相似度差異,對(duì)數(shù)字音頻的版權(quán)管理問題予以更好的保護(hù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于復(fù)旦大學(xué),未經(jīng)復(fù)旦大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810445754.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用頻譜分析,例如變換聲碼器或子頻帶聲碼器
G10L19-04 .利用預(yù)測(cè)技術(shù)
G10L19-06 ..例如短期預(yù)測(cè)系數(shù)的頻譜特征的確定或編碼
G10L19-08 ..激勵(lì)函數(shù)的確定或編碼;長(zhǎng)期預(yù)測(cè)參數(shù)的確定或編碼
G10L19-14 ..不包括在G10L 19/06至G10L 19/12組中的零部件,例如增益編碼、后置濾波設(shè)計(jì)或聲碼器結(jié)構(gòu)
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 亮度信號(hào)/色信號(hào)分離裝置和亮度信號(hào)/色信號(hào)分離方法
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 雙耳信號(hào)的信號(hào)生成
- 雙耳信號(hào)的信號(hào)生成
- 信號(hào)處理裝置、信號(hào)處理方法、信號(hào)處理程序
- USBTYPEC信號(hào)轉(zhuǎn)HDMI信號(hào)的信號(hào)轉(zhuǎn)換線
- 信號(hào)盒(信號(hào)轉(zhuǎn)換)
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 相似圖像提取裝置、相似圖像提取方法以及相似圖像提取程序
- 一種鋼結(jié)構(gòu)火災(zāi)反應(yīng)分析方法
- 相似度計(jì)算裝置、相似度計(jì)算方法以及相似度計(jì)算程序
- 一種蛋白質(zhì)相似度及相似蛋白質(zhì)的確定方法和系統(tǒng)
- 一種獲取相似語(yǔ)句的方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種圖像搜索方法、裝置和存儲(chǔ)介質(zhì)
- 基于相似壽命模型和相似壽命的復(fù)雜產(chǎn)品可靠性評(píng)定方法
- 獲取機(jī)構(gòu)技術(shù)相似性的方法及裝置
- 口罩(相似)
- 臺(tái)燈(相似)





