[發明專利]一種音頻指紋的提取方法、裝置、電子設備及存儲介質在審
| 申請號: | 202010845686.X | 申請日: | 2020-08-20 |
| 公開(公告)號: | CN112037814A | 公開(公告)日: | 2020-12-04 |
| 發明(設計)人: | 陳曉敏;姜濤 | 申請(專利權)人: | 北京達佳互聯信息技術有限公司 |
| 主分類號: | G10L25/03 | 分類號: | G10L25/03;G10L25/18;G10L25/54;G10L25/51;G10L17/00 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 石磊 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 音頻 指紋 提取 方法 裝置 電子設備 存儲 介質 | ||
本公開提供一種音頻指紋的提取方法、裝置、電子設備及存儲介質,涉及聲紋識別技術領域,用于提高音頻指紋的魯棒性。該方法包括:確定待處理的音頻信號,并對待處理的音頻信號進行頻譜特征提取處理,獲得目標頻譜圖;從目標頻譜圖中提取局部區域峰值點,獲得局部峰值點候選集,局部峰值點候選集包括目標頻譜圖上按照預設頻段劃分的各區域中的峰值點;從目標頻譜圖的平坦區域中提取峰值點,獲得平坦區域的局部峰值點集合;基于局部峰值點候選集和平坦區域的局部峰值點集合,得到目標局部峰值點集合,并根據目標局部峰值點集合確定待處理的音頻信號的音頻指紋,目標局部峰值點集合包括從局部峰值點候選集中剔除平坦區域的局部峰值點集合中的峰值點。
技術領域
本公開涉及聲紋識別技術領域,尤其涉及一種音頻指紋的提取方法、裝置、電子設備及存儲介質。
背景技術
目前,基于音頻指紋的音頻檢索在聽歌識曲、身份認證等多種場景有較為廣泛的應用。
相關技術中,在提取音頻指紋時,存在提取的音頻信號對應頻譜上的局部峰值點數量過多,對噪聲處理的魯棒性較差,從而導致音頻指紋變多,即在一定程度上降低了基于音頻指紋檢索方法中音頻指紋的索引性能。
發明內容
本公開提供一種音頻指紋的提取方法、裝置、電子設備及存儲介質,以提高音頻指紋的魯棒性。本公開的技術方案如下:
根據本公開實施例的第一方面,提供一種音頻指紋的提取方法,所述方法包括:
確定待處理的音頻信號,并對所述待處理的音頻信號進行頻譜特征提取處理,獲得目標頻譜圖;
從所述目標頻譜圖中提取局部區域峰值點,獲得局部峰值點候選集,所述局部峰值點候選集包括所述目標頻譜圖上按照預設頻段劃分的各區域中的峰值點;以及,
從所述目標頻譜圖的平坦區域中提取峰值點,獲得平坦區域的局部峰值點集合,其中,所述平坦區域為所述目標頻譜圖中與相鄰能量值的差值屬于第一預定范圍,且能量值小于第一預定值的多個能量值所組成的連通區域;
基于所述局部峰值點候選集和所述平坦區域的局部峰值點集合,得到目標局部峰值點集合,并根據所述目標局部峰值點集合確定所述待處理的音頻信號的音頻指紋,其中,所述目標局部峰值點集合包括從所述局部峰值點候選集中剔除所述平坦區域的局部峰值點集合中的峰值點。
在一種可能的實施方式中,所述從所述目標頻譜圖的平坦區域中提取峰值點,獲得平坦區域的局部峰值點集合,包括:
確定所述目標頻譜圖的平坦區域;
對所述平坦區域進行蝕刻處理,獲得第一平坦區域,并對所述第一平坦區域進行最大值池化處理,以獲得所述第一平坦區域的局部峰值點集合。
在本公開實施例中,可以先確定目標頻譜圖中的平坦區域,然后對平坦區域進行蝕刻處理以獲得第一平坦區域,并獲得第一平坦區域的局部峰值點集合。這樣的方式,可以確定與其它音頻信號可能會相同的平坦區域,減少了容易造成混淆的峰值點,使得提取音頻指紋更具有魯棒性。
在一種可能的實施方式中,所述確定所述目標頻譜圖的平坦區域,包括:
對所述目標頻譜圖進行均值池化處理,得到所述目標頻譜圖對應的局部平均值圖;
將所述目標頻譜圖的能量值減去所述局部平均值圖中的能量值,獲得處理值集;
若確定所述處理值集中的多個處理值與第二預定閾值的差值屬于預定范圍,則根據所述多個處理值對應的能量值在所述目標頻譜圖中的位置,確定所述目標頻譜圖的平坦區域。
在本公開實施例中,可以將目標頻譜圖的能量值減去局部平均值圖中的能量值獲得處理值集,并當確定處理值集中的多個處理值與第二預定閾值的差值屬于預定范圍時,確定平坦區域。這樣的方式,可以高效且準確的確定平坦區域。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京達佳互聯信息技術有限公司,未經北京達佳互聯信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010845686.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于人工智能的全方位避讓裝置
- 下一篇:一種用于提供視頻信息的方法與設備





