[發明專利]音樂搜索設備及方法、程序以及記錄介質有效
| 申請號: | 201210107281.1 | 申請日: | 2012-04-12 |
| 公開(公告)號: | CN102750948A | 公開(公告)日: | 2012-10-24 |
| 發明(設計)人: | 澁谷崇;安部素嗣 | 申請(專利權)人: | 索尼公司 |
| 主分類號: | G10L11/00 | 分類號: | G10L11/00 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 陳煒;李春暉 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音樂 搜索 設備 方法 程序 以及 記錄 介質 | ||
技術領域
本技術涉及音樂搜索設備及方法、程序以及記錄介質,并且尤其涉及能夠從輸入信號中設別出音樂的音樂搜索設備及方法、程序以及記錄介質。
背景技術
過去,為了識別作為輸入信號而輸入的音樂,進行將輸入信號的特征量與作為要被識別的音樂的候選的參考信號的特征量進行匹配的處理。然而,例如,當諸如戲劇的電視節目的音頻源被用作輸入信號時,包括諸如對話、聲音(環境噪聲)、白噪聲、粉紅噪聲以及音效的非音樂信號分量的噪聲分量(在下文中簡稱為“噪聲”)經常與諸如背景音樂(BGM)的音樂信號分量混合,并且由這種噪聲導致的輸入信號的特征量的變化影響匹配處理結果。
就這一點而言,已經提出了如下技術:該技術使用屏蔽模式來屏蔽輸入信號的特征量中具有低可靠性的分量,從而只使用具有高可靠性的分量來進行匹配處理。
特別地,針對特征矩陣預先準備多種屏蔽模式,其中特征矩陣代表被變換為時頻域中的信號的輸入信號的特征量,而屏蔽模式用于屏蔽與預定的時頻域相對應的矩陣分量。使用所有屏蔽模式進行輸入信號的特征量與數據庫中多個參考信號的特征量之間的匹配處理。被計算出最高相似度的那個參考信號的音樂被識別為輸入信號的音樂(例如,參見日本專利申請公開(JP-A)2009-276776)。
發明內容
然而,難以評估輸入信號上疊加有噪聲的時間和頻率,并且難以預先準備適合于輸入信號的屏蔽模式。因此,在JP-A?2009-276776中公開的技術中,難以進行適當的匹配處理,因而很難以高準確度從音樂與噪聲混合的輸入信號中識別出音樂。
同時,還存在這樣一種技術:該技術產生屏蔽模式,使得輸入信號中平均功率高的時間段中的分量被視為疊加有音樂以外的噪聲的分量,并且只使用輸入信號中平均功率低的時間段的特征量進行匹配。根據該技術,盡管可以產生取決于輸入信號的屏蔽模式,但是該屏蔽模式中沒有考慮到頻率分量,并且該屏蔽模式不一定是適于輸入信號的屏蔽模式。此外,如圖1的左側所示,在時頻域的輸入信號中,音樂信號分量DM中包括了來自對話的噪聲Dv。在此情況下,在該技術中,只使用對話中斷的區域S1和S2中的幾個段的特征量來進行匹配處理。因此,很難以高準確度從音樂與噪聲混合的輸入信號中識別出音樂。為了以高準確度從音樂與噪聲混合的輸入信號中識別出音樂,希望使用如圖1的右側所示的區域S3和S4中的音樂信號分量Dm的特征量來進行匹配處理。
本技術是鑒于上述問題而作出的,并且希望以高準確度從輸入信號中識別出音樂。
根據本技術的一實施例,提供了一種音樂搜索設備,用于將輸入信號與僅包括音樂的參考信號進行比較并識別所述輸入信號的音樂,所述音樂搜索設備包括:指數計算單元,用于基于變換到時頻域的所述輸入信號的每個區域的信號分量的強度和通過對所述信號分量的強度進行近似而獲得的函數,計算所述信號分量的音調指數;相似度計算單元,用于計算基于所述指數而獲得的所述輸入信號的每個區域中的特征量與基于對變換到所述時頻域的所述參考信號計算出的指數而獲得的所述參考信號的每個區域中的特征量之間的相似度;以及音樂識別單元,用于基于所述相似度來識別所述輸入信號的音樂。
所述指數計算單元可以包括:最大點檢測單元,用于從預定時間段的所述輸入信號中檢測所述信號分量的強度為最大的最大點;以及近似處理單元,用于通過模板函數對所述最大點附近的所述信號分量的強度進行近似,并且,所述指數計算單元可以基于所述最大點附近的所述信號分量的強度與所述模板函數之間的誤差來計算所述指數。
所述指數計算單元可以根據所述模板函數的曲率來調節所述指數。
所述指數計算單元可以根據所述模板函數的最大點的頻率來調節所述指數。
所述音樂搜索設備可以進一步包括權重分布產生單元,用于基于所述輸入信號的每個區域中的第一特征量和所述參考信號的每個區域中的第一特征量來產生所述輸入信號和所述參考信號的每個區域上的權重分布,并且計算所述輸入信號的每個區域中的第一特征量與所述參考信號的每個區域中的第一特征量之間的第一特征量相似度。所述相似度計算單元基于所述權重分布的權重和所述第一特征量相似度來計算所述輸入信號的每個區域中的第二特征量與所述參考信號的每個區域中的第二特征量之間的相似度。
所述音樂搜索設備可以進一步包括:第一特征量計算單元,用于計算通過在時間方向上過濾所述指數而獲得的所述指數的時間平均量,作為所述第一特征量;以及第二特征量計算單元,用于計算通過在時間方向上過濾所述指數而獲得的所述指數的時間變化量,作為所述第二特征量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于索尼公司,未經索尼公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210107281.1/2.html,轉載請聲明來源鉆瓜專利網。





