[發明專利]基于音頻能量特性的音頻指紋識別有效
| 申請號: | 201780034005.8 | 申請日: | 2017-04-07 |
| 公開(公告)號: | CN109644283B | 公開(公告)日: | 2021-07-30 |
| 發明(設計)人: | 帕特里克·格林 | 申請(專利權)人: | 源數碼有限公司 |
| 主分類號: | H04N21/233 | 分類號: | H04N21/233;H04N21/242;H04N21/422;H04N21/43;H04N21/439;H04N21/4722;H04N21/858 |
| 代理公司: | 北京柏杉松知識產權代理事務所(普通合伙) 11413 | 代理人: | 謝攀;劉繼富 |
| 地址: | 美國賓夕*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 音頻 能量 特性 指紋識別 | ||
音頻指紋識別包括:獲取一段音頻的音頻樣本,生成音頻樣本的頻率表示,識別頻率表示的頻帶中能量增加區域和能量減少區域,以及生成該段音頻的特征的散列。特征的每個散列對應于所識別的能量區域出現在相應時間窗口中的部分。每個特征都定義為對信息編碼的數值,所述信息表示:出現在相應時間窗口中的能量區域的頻帶、出現在相應時間窗口中的能量區域是否為能量增加區域或者出現在相應時間窗口中的能量區域是否為能量減少區域、出現在相應時間窗口中的能量區域的位置。
技術領域
本公開總體涉及音頻內容識別(ACR),更具體地涉及根據音頻能量特性生成音頻指紋。
背景技術
在各種應用中,越來越多地用到對音頻內容的實時識別。例如,可以識別未知歌曲的名稱、藝術家和/或專輯,或者可以從特定電影的聲道識別出該電影。ACR算法包括聲學指紋識別,其工作原理為:分析一段音頻(音樂、電影等)并根據該音頻的特性生成所謂的指紋。為了識別一條音頻內容,將根據該條音頻生成的音頻指紋與參考音頻指紋的數據庫進行比較。
目前存在幾種廣泛使用的聲學指紋算法。一個常見的例子是Shazaam應用,它利用聲學指紋來識別用戶正在聽的歌曲。其他例子包括Gracenote和MusicBrainz。
然而,傳統音頻內容識別至少有以下限制:傳統方案無法檢測或對準內容的時序,即相對于內容的總時間的當前時間位置。傳統音頻內容識別的其他限制包括指紋的大小相對較大、內容識別過程相對復雜以及內容識別中存在延遲。
發明內容
本公開提供了解決這些問題的方法、設備和系統。本公開描述了音頻內容識別算法,并具體地描述了指紋生成算法,該指紋生成算法允許檢測音頻內容中相對于該內容總時間的位置。例如,本文公開的發明不僅可以識別一條內容的身份(即正在觀看的電影是Goodfellas),還可以識別該電影當前處于3:30標記處。另外,與傳統技術相比,所公開的發明提供了大小相對小的指紋和相對簡單的內容識別過程,從而減少了內容識別的延遲,解決了傳統音頻內容識別的限制。
并入說明書并構成說明書的一部分的附圖圖示了各個示例系統、方法等,這些示例系統、方法等說明了本發明的各個方面的各個示例實施例。應當理解,圖中所示的元素邊界(例如,框、框組或其他形狀)表示邊界的一個示例。本領域普通技術人員可以理解,一個元素可以被設計為多個元素,或者多個元素可以被設計為一個元素。作為另一元素的內部組件示出的元素可以實現為外部組件,反之亦然。此外,元素可以不按比例繪制。
圖1示出了用于音頻指紋識別的示例性系統的框圖。
圖2示出了圖1中用于音頻指紋識別的系統的詳細框圖。
圖2A示出了示例性采樣過程。
圖2B為電影的一部分的示例性能量區域的示意圖。
圖2C為示例性能量散列器的示意圖。
圖2D為示例性散列、分片MinHash和指紋散列的示意圖。
圖3示出了在音頻內容識別環境中的圖1中用于音頻指紋識別的系統。
圖4示出了用于音頻指紋識別的示例性方法的流程圖。
圖5示出了用于音頻指紋識別的示例性機器或設備的框圖。
具體實施方式
圖1示出了用于音頻內容識別的示例性系統1的框圖。通常,系統1通過如下方式工作:分析一段音頻(例如歌曲、電影聲道等)并根據音頻的聲學特性生成指紋。例如,系統1可用于識別用戶可能正在觀看的內容(例如,電視節目、電影、YouTube視頻),并且還檢測相對于內容的總時間的位置。因此,例如,系統1不僅可以識別一條內容的身份(即正在觀看的電影是Goodfellas),還可以識別該電影當前處于3:30標記處。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于源數碼有限公司,未經源數碼有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780034005.8/2.html,轉載請聲明來源鉆瓜專利網。





