[發明專利]一種基于時頻局部能量的特征點的音頻檢索方法和系統在審
| 申請號: | 201810107532.3 | 申請日: | 2018-02-02 |
| 公開(公告)號: | CN108197319A | 公開(公告)日: | 2018-06-22 |
| 發明(設計)人: | 胡俊;李湑;陳毅 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京華仲龍騰專利代理事務所(普通合伙) 11548 | 代理人: | 李靜 |
| 地址: | 400065 *** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 局部能量 音頻指紋 特征點 音頻檢索 預處理 數據庫索引 特征點匹配 相似度 時頻 時域 海量音頻數據庫 計算機應用領域 抗噪聲性能 相似度計算 音頻數據庫 候選查詢 檢索效率 兩套系統 音頻片段 有效解決 正確率 構建 兩套 算法 排序 檢索 語音 輸出 音樂 | ||
1.一種基于時頻局部能量的特征點的音頻檢索方法,其特征在于:該方法對于音頻數據庫中的每一首音頻,先進行重采樣、預加重和加窗處理的預處理,然后再提取時域局部能量很突出的點作為特征點,用特征點匹配成音頻指紋,利用音頻指紋構建數據庫索引;對于樣例查詢音頻片段,也是先進行重采樣、預加重和加窗處理的預處理,然后再提取時域局部能量很突出的點作為特征點,用特征點匹配成音頻指紋;在線的音頻指紋在數據庫索引中進行候選查詢,找出候選的音頻,然后對候選的所有音頻進行相似度計算;對得出的所有相似度進行排序,輸出相似度最高的音頻以及音頻的信息;
具體包括以下步驟:
S1:基于語譜圖的矩形局部能量比值的特征,提取音頻數據庫穩定的特征點;
S2:根據音頻數據庫穩定的特征點匹配成特征點對,即音頻指紋;音頻指紋對比單個的特征點對,具有信息的區分性,減少信息之間的碰撞;
S3:構造哈希索引表,把得到的音頻指紋通過指紋哈希函數轉換成哈希索引表的關鍵字,通過哈希索引把關鍵字存于哈希索引對應的內存之中;鍵為關鍵字,值為音頻指紋所在音頻文件名以及在音頻文件中的位置;
S4:基于語譜圖的矩形局部能量比值特征,提取用戶輸入樣例音頻片段的頻譜特征點;
S5:根據樣例音頻片段的頻譜特征點匹配成特征點對,即音頻指紋;
S6:把所有得到的音頻指紋通過哈希索引表,進行音頻指紋的匹配;
S7:返回給用戶目的音頻的具體信息。
2.根據權利要求1所述的一種基于時頻局部能量的特征點的音頻檢索方法,其特征在于:所述語譜圖的矩形局部能量比值為Er,即以一個點為中心,其坐標值看作(k,k),設置大小兩個矩形區域,大小分別為(a1,b1)和(a2,b2),用大矩形區域內點的能量值之和除以小矩形區域內點的能量值之和,得到的比值是能量比值Er;當一個點的Er大于等于某一閾值時,則認為該點是特征點;提取的坐標點為特征點的公式為:Er≥T0;T0為閾值。
3.一種基于時頻局部能量的特征點的音頻檢索系統,其特征在于:該系統包括離線音頻數據庫處理模塊和在線檢索模塊;
所述離線音頻數據庫處理模塊包括:音頻數據單元101、音頻指紋提取單元102和哈希索引庫103,用于實現:
(1)基于語譜圖的矩形局部能量比值的特征,提取音頻數據庫穩定的特征點;
(2)根據音頻數據庫穩定的特征點匹配成特征點對,即音頻指紋;音頻指紋對比單個的特征點對,具有信息的區分性,減少信息之間的碰撞;
(3)構造哈希索引表,把得到的音頻指紋通過指紋哈希函數轉換成哈希索引表的關鍵字,通過哈希索引把關鍵字存于哈希索引對應的內存之中;鍵為關鍵字,值為音頻指紋所在音頻文件名以及在音頻文件中的位置;
所述在線檢索模塊包括:樣例音頻片段單元104、音頻指紋單元105,哈希索引表匹配查找單元106和命中的第一個結果返回單元107,用于實現:
(1)基于語譜圖的矩形局部能量比值特征,提取用戶輸入樣例音頻片段的頻譜特征點;
(2)根據樣例音頻片段的頻譜特征點匹配成特征點對,即音頻指紋;
(3)把所有得到的音頻指紋通過哈希索引表,進行音頻指紋的匹配;
(4)返回給用戶目的音頻的具體信息;
用戶通過移動設備輸入從原始音頻截取的片段或者通過其他形式重新錄制一段音頻片段,這些片段中含有噪聲,移動設備把接收到的音頻片段上傳后臺服務器,服務器對音頻片段進行音頻指紋提取,然后離線與已經構造好的哈希索引表中的指紋進行匹配,得到一個目的音頻以及音頻的信息,服務器把得到的音頻信息傳給移動設備,顯示給用戶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810107532.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:人臉識別方法、裝置、機器人及存儲介質
- 下一篇:一種多視圖圖像自動標注方法





