[發明專利]一種用于音頻內容識別的同步方法有效
| 申請號: | 200810243580.1 | 申請日: | 2008-12-23 |
| 公開(公告)號: | CN101763848A | 公開(公告)日: | 2010-06-30 |
| 發明(設計)人: | 王宏宇;楊光;嚴榮榮;曹輝 | 申請(專利權)人: | 王宏宇 |
| 主分類號: | G10H1/00 | 分類號: | G10H1/00;G10H1/36;G10L15/00;G10L15/20;G10L15/02 |
| 代理公司: | 南京知識律師事務所 32207 | 代理人: | 樊文紅 |
| 地址: | 210018 江蘇省南京市*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 音頻 內容 識別 同步 方法 | ||
技術領域
本發明涉及數字信號處理、音頻信號處理及軟件技術,具體地說涉及一種用于音頻 信息內容識別的同步方法。
背景技術
隨著計算機網絡和現代通信技術的發展,多媒體信息的容量得到了飛速的增加。 多媒體信息已經成了人們日常生活中不可或缺的一部分。
音頻在多媒體信息中占有相當大的比例,因此對音頻信息的識別也就有了實際的意 義。
在特征維數存儲空間有限的條件下,得到兩個音頻后,為了識別兩個音頻信息是 否相同,對接下來的信息進行提取特征。為了使有公共部分的音樂片段,能夠提取出共 有的音樂片段的特征,以作度量,就需要對兩個音頻同步,即假如兩個是大致相同的音 頻內容的話,但是由于起始時間上不是完全一致,為了提取信息特征時采用相同的成分, 就需要先對兩段音頻同步,使二者有共同的參考點或參考點組,即對相似的,但長度大 小又不同的音頻,找到共有的音頻段去處理。它們之間應該有同步點使二音頻對應起來。 同步點一般在特征突變位置時,比較好標記。
在此之前,已有數種提取節拍的嘗試。在中華人民共和國國家知識產權局的公開 專利200610108649.0中公開了拍子提取及檢測設備和方法、音樂同步顯示設備和方法, 其利用檢測輸入音樂信號的聲譜圖中,功率譜的急劇變化來提取拍子,計算自相關來推 算節拍值。公開專利200480008226.0中公開了一種拍子分析裝置和拍子分析方法,其 根據從分析數據提取來的聲音信號的電平信息,以規定的單位時間區間的幀作為處理單 元,檢測出在規定電平以上的峰值位置,并求該幀區間中的各峰值位置之間的間隔,將 發生頻度高的峰值間隔決定為拍子。
上述專利中的節奏提取,主要為了獲得音樂的拍子,得到整段音樂的節拍,主要 針對的是音樂信號。
發明內容
本發明的目的在于克服現有技術的不足,提供一種為了識別兩個音頻信息的異同, 將兩個音頻同步的方法。該方法既適用于音樂信息的識別中,又適用于語音信息的識別。
實現本發明目的技術方案是:一種用于音頻內容識別的同步方法,該方法包括下列
步驟:
步驟1提取兩個音頻信號的頻域或時域的特征點;
步驟2將兩個音頻的特征點分別組成特征點組;
步驟3對兩個特征點組進行匹配,找到匹配點,將二者在匹配點上開始同步。
音頻文件的識別中存在兩種不同情況,其中之一是兩個不同的音頻文件的同步問 題,毫無疑問,兩個完全不同的音頻文件,無論如何都不可能達到同步,但是我們也可 以認為,他們任何時候都是同步的,只是同步后的內容不同,因此,本發明中的特征點 組匹配后得到的匹配點就可以作為其同步點,只是后續的特征提取所得到的特征不同而 已。另一種情況是兩個基本相同的文件的同步問題,可以認為有公共部分的兩個文件, 其一定可以找到相同的點,這個點之后的同樣大小的部分則可以認為是這兩個音頻文件 所共有的部分。這樣一來,有共有部分的音頻文件就可以看作是同步了,同步點之后的 就可以認為是相同的內容了。
本發明中的特征點組通過提取頻域或時域特征點進行組合的方式來實現,可以用于 音樂信息和語音信息的識別中的同步。
作為本發明的進一步改進,所述步驟1中,采用以幀為單位,計算歸一化能量差的 方式提取特征點。
作為本發明的進一步改進,所述步驟2中,選取幀間能量差最大的若干點組成特征 點組。
作為本發明的進一步改進,所述步驟3中,可由特征點組之間的時間差做參考同步 特征,即如果音頻a中參考點之間的時間差和b中參考點之間的時間差相同或者在允許 的誤差范圍內,則可以認為a中某個參考點和b中某個參考點構成了a和b的同步點。
本發明中,所述提取兩個音頻信號的頻域特征點步驟中,具體包括以下步驟:
將音頻段以幀為單位轉化到頻域,經過梳狀濾波器組濾波,并進行歸一化;
選取幀間能量差最大的特征點組成特征點組。對于和某個濾波器中心頻率有共鳴或 相近的地方,信號將有較大的增幅導致能量激增。
本發明中,所述步驟1中,具體包括以下步驟:
將音頻以幀為單位進行處理,計算各幀能量,計算能量差,并歸一化;
選取較大的能量差的點組成特征點組。由于音頻信號在時域中是緩慢變化的信號。 但是在節奏突變處,將有明顯的跳動,導致前后兩幀能量有較大的反差,這些點可形成 特征點組。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于王宏宇,未經王宏宇許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810243580.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種移動硬盤及移動硬盤盒
- 下一篇:一種建筑用輕質夾心板
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





