[發明專利]一種音頻文件的識別方法和裝置有效
| 申請號: | 201110218558.3 | 申請日: | 2011-08-01 |
| 公開(公告)號: | CN102314875A | 公開(公告)日: | 2012-01-11 |
| 發明(設計)人: | 朱中的;李彥宏 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L19/00;G06F17/30 |
| 代理公司: | 深圳市威世博知識產權代理事務所(普通合伙) 44280 | 代理人: | 何青瓦;李慶波 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 音頻文件 識別 方法 裝置 | ||
【技術領域】
本發明涉及計算機技術領域,特別涉及一種音頻文件的識別方法和裝置。
【背景技術】
音頻文件包括記錄在各種存儲形式上、通過網絡在服務器和客戶端之間作為數字文件流傳輸或者通過模擬和數字電磁信號傳輸的音樂、講話或聲音等。隨著計算機網絡技術以及存儲技術的快速發展,音頻文件隨著時間擴大呈海量增長之勢,對音頻文件的識別也開始變得重要,無論是對音頻文件的管理、網絡資源的優化等都具有重要的意義。
【發明內容】
本發明提供了一種音頻文件的識別方法和裝置,實現對音頻文件的識別,從而為音頻文件的管理和網絡資源的優化提供基礎。
具體技術方案如下:
一種音頻文件的識別方法,該識別方法包括:
對已知類型的音頻文件進行音頻指紋提取,利用提取的音頻指紋建立所述已知類型的音頻指紋庫,所述音頻指紋庫中的各音頻指紋以各自第N段指紋的數據作為索引,所述N為預設正整數;
接收到待識別音頻文件時,提取所述待識別音頻文件的第N段指紋的局部音頻指紋,將所述局部音頻指紋與所述音頻指紋庫的索引進行匹配,如果匹配成功,則識別出所述待識別音頻文件為所述已知類型。
具體地,所述音頻指紋提取具體包括:
A1、將所述音頻文件進行解碼,得到預設的音頻格式;
A2、將步驟A1得到的音頻文件進行指定采樣率的轉換;
A3、對音頻文件中的音頻信號進行傅里葉變換;
A4、計算所述音頻文件的各段音頻信號中相鄰幀之間的能量差并進行編碼,得到各段音頻指紋構成的所述音頻文件的音頻指紋。
其中,提取所述待識別音頻文件的第N段指紋的局部音頻指紋具體包括:
B1、將所述待識別音頻文件進行解碼;
B2、將解碼后的待識別音頻文件進行指定采樣率的轉換;
B3、對待識別音頻文件中的音頻信號進行傅里葉變換;
B4、計算待識別音頻文件的第N段音頻信號中從第M1幀開始連續M2幀的相鄰幀之間的能量差并進行編碼,得到局部音頻指紋,所述M1和所述M2為預設的正整數。
或者,提取所述待識別音頻文件的第N段指紋的局部音頻指紋具體包括:
C1、將所述待識別音頻文件的第N段音頻信號進行解碼;
C2、將解碼后的所述待識別音頻文件的第N段音頻信號進行指定采樣率的轉換;
C3、對待識別音頻文件的第N段音頻信號進行傅里葉變換;
C4、計算待識別音頻文件的第N段音頻信號中從第M1幀開始連續M2幀的相鄰幀之間的能量差并進行編碼,得到局部音頻指紋,所述M1和所述M2為預設的正整數。
其中,所述進行指定采樣率的轉換包括:
使用小波函數對被轉換的音頻文件中的音頻信號進行循環濾波,每一次循環濾波進行一次下采樣,直至被轉換的音頻文件達到預設的分辨率。
將所述局部音頻指紋與所述音頻指紋庫的索引進行匹配具體包括:
D1、將所述局部音頻指紋與音頻指紋庫中當前匹配到的索引進行對齊處理,如果能夠對齊,則執行步驟D2;如果不能夠對齊,則開始下一個索引的匹配,轉至步驟D1;
D2、計算所述局部音頻指紋與當前匹配到的索引中相應對齊長度的指紋之間的匹配度,如果匹配度在預設的匹配度閾值內,則確定所述局部音頻指紋與所述當前匹配到的索引匹配成功;否則,確定所述局部音頻指紋與所述當前匹配到的索引匹配失敗,進行下一索引的匹配,轉至步驟D1。
步驟D1中將所述局部音頻指紋與音頻指紋庫中當前匹配到的索引進行對齊處理具體為:
將所述局部音頻指紋的第一個整型數與當前匹配到的索引中的各整型數依次進行匹配處理,如果所述局部音頻指紋的第一個整型數與當前匹配到的索引中的一個整型數匹配成功,則將匹配成功的兩個整型數對齊;或者,
將所述局部音頻指紋的第一個整型數與當前匹配到的索引中預設窗口內的各整型數依次進行匹配處理,所述窗口包含所述局部音頻指紋在所述待識別音頻文件的第N段音頻信號的開始幀數,如果所述局部音頻指紋的第一個整型數與所述窗口中的一個整型數匹配成功,則將匹配成功的兩個整型數對齊。
步驟D2中計算所述局部音頻指紋與當前匹配到的索引中相應對齊長度的匹配度具體為:
計算所述局部音頻指紋中第一個整型數之后的其他整型數與所述當前匹配到的索引中相應對齊長度的整型數之間的匹配度。
所述匹配處理包括:
判斷兩個整型數是否完全一致,如果一致,則確定兩個整型數匹配成功;或者,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110218558.3/2.html,轉載請聲明來源鉆瓜專利網。





