[發明專利]一種基于聲紋技術的音頻信號實時追蹤比對方法有效
| 申請號: | 202110704405.3 | 申請日: | 2021-06-24 |
| 公開(公告)號: | CN113409817B | 公開(公告)日: | 2022-05-13 |
| 發明(設計)人: | 許國法 | 申請(專利權)人: | 浙江松會科技有限公司 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51;G10L25/24;H04H60/29 |
| 代理公司: | 杭州浙科專利事務所(普通合伙) 33213 | 代理人: | 孫孟輝 |
| 地址: | 311301 浙江省杭州市臨安*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 聲紋 技術 音頻 信號 實時 追蹤 方法 | ||
本發明屬于信號處理領域,公開了一種基于聲紋技術的音頻信號實時追蹤比對方法。首先獲取源聲紋和目標聲紋向量置入相應矩陣緩存;然后計算源聲紋與目標聲紋的歐式距離,得到歐式距離矩陣Dxs;判斷上次延遲時間、Dxs最小值對應延遲時間、Dxs行算數平均數最小值對應延遲時間;分別計算延遲時間對應相似度,通過相似度進行延遲時間二次判定;對于延遲時間相似與不相似狀態躍變,引入延遲處理機制;通過輸出延遲時間對齊源音頻與目標音頻;計算相應通道在線指標;如此重復循環動態跟蹤源音頻與目標音頻。本發明基于聲紋技術,利用倒譜分析,在環境干擾較大時,播出信號和空收信號能持續動態對齊,計算出播出信號和空收信號的延遲量。
技術領域
本發明屬于信號處理領域,尤其涉及一種基于聲紋技術的音頻信號實時追蹤比對方法。
背景技術
在廣播轉播臺的安全播出監測中,為了客觀分析和度量發射機的性能指標,需要對送入發射機的播出信號(以下簡稱播出信號)和發射后播出空收回傳信號(以下簡稱空收信號)進行對比。
廣播信號,特別是中波信號極易受到天氣、環境等影響和干擾,諸如太陽黑子活動、大氣層變化的影響,空收信號與播出信號差異較大。因此,播出信號和空收信號對齊一直是難題,傳統采用音頻包絡對比和能量值比對的方法,在一定程度內可以實現信號的動態對齊,但是隨著干擾的增大,極易造成對齊同步丟失。
發明內容
本發明目的在于提供一種基于聲紋技術的音頻信號實時追蹤比對方法,以解決當環境干擾較大時,播出信號和空收信號對齊同步丟失的技術問題。
為解決上述技術問題,本發明的一種基于聲紋技術的音頻信號實時追蹤比對方法的具體技術方案如下:
一種基于聲紋技術的音頻信號實時追蹤比對方法,包括如下步驟:
P1:計算聲紋,定義播出音頻為源音頻,空收音頻為目標音頻,對播出音頻和空收音頻進行預處理,分別獲取源聲紋和目標聲紋向量,并置入相應矩陣緩存;
P2:計算向量距離,以目標聲紋為軸,按最小步進以秒為單位分別計算源聲紋與目標聲紋的歐式距離,計算得到歐式距離矩陣Dxs;
P3:初步判定延時時間,通過歐式距離矩陣Dxs,判斷上次延遲時間tlast、Dxs最小值對應延遲時間tmin、Dxs行算數平均數最小值對應延遲時間tline;
P4:細化判定延遲時間,分別計算tlast、tmin 、tline對應相似度,通過相似度進行延遲時間二次判定;
P5:躍變判定,對于延遲時間相似與不相似狀態躍變,引入延遲處理機制;若發生相似到不相似狀態躍變,或者不相似到相似狀態躍變,則定義sim_min下限閾值和sim_max上限閾值,分別對應兩個狀態的躍變,如果n次均低于sim_min下限閾值或高于sim_max上限閾值,表示狀態躍變成功;
P6:對齊音頻,通過輸出延遲時間對齊源音頻與目標音頻;
P7:計算源音頻與目標音頻相應通道在線指標;
P8:重復P1- P7,循環動態跟蹤源音頻與目標音頻。
進一步地,所述預處理包括如下步驟:
S1:預加重,補償高頻部分;
S2:分幀,多個采樣點劃分為幀;
S3:加窗,使用漢明窗用于平滑信號,減弱FFT以后旁瓣大小以及頻譜泄露;
S4:快速傅里葉變換,將時域特征轉換為頻域上分布;
S5:幅度譜平方,轉換為功率譜;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江松會科技有限公司,未經浙江松會科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110704405.3/2.html,轉載請聲明來源鉆瓜專利網。





