[發明專利]一種實時音頻比對方法在審
| 申請號: | 201410814218.0 | 申請日: | 2015-08-04 |
| 公開(公告)號: | CN104505101A | 公開(公告)日: | 2015-07-29 |
| 發明(設計)人: | 張丹;胡志琳;李佳驊;石建 | 申請(專利權)人: | 北京巴越赤石科技有限公司 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100033 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 實時 音頻 方法 | ||
技術領域
本發明涉及一種判斷兩路實時音頻信號的內容是否相同的比對方法。
背景技術
兩路實時音頻信號一般是經過不同的傳輸通道傳入的,因為信道傳輸的延時,會造成兩路信號在到達時間上的不同步。因此對這兩路實時音頻要做的第一件事情是進行同步計算,找出兩路信號的延時大小。同步的結果會極大影響后續比對的準確度。
所以在實時音頻的比對中,同步算法是最關鍵的模塊。
現有技術中,判斷兩路音頻信號是否同步,具有多種方法:
1)有輔助信息的同步,例如?“音頻水印”技術,是在原始音頻中插入一些額外的輔助信息,依靠這些輔助信息進行同步。這些特定的信息耳朵聽不到,但是設備可以檢測出來,用這些信息輔助進行同步。但這種方法一定程度上會降低聲音的質量,另外前端需要安裝特殊設備,提高了成本。
2)無輔助信息的同步,可以再細分為
a.?時間域上的同步計算:根據音頻信號的時間特性的相關性來計算延時。可以使用的時間特性包括時域的信號包絡,或者是音頻能量的變化趨勢等。這類算法的優點是計算量小,因為不需要變換到頻域。缺點是很容易受到噪聲、信道衰減的影響,準確率低,難以收斂。
b.?變換域上的同步計算:把音頻信號變換到頻域(或其他變換域),根據頻域特征值的相關性來計算延時。這類算法的優點是準確性較高。由于利用了頻域的特性,符合人耳辯聲的原理,受噪聲和衰減的影響小。缺點是涉及到時頻變換,計算量大。
因此,現有的各種技術都存在缺陷,有待于進一步改進和發展。
發明內容
本發明的目的是提供一種計算量小,精度高的兩路實時音頻信號的對比方法。
為了實現上述目的,本發明采用如下技術方案:
一種實時音頻比對方法,用于對兩路實時的音頻信號進行比較分析,判斷兩路信號是否為同樣的內容,具體包括:
兩路音頻信號的初始同步和兩路音頻的周期比對;
所述兩路音頻信號的初始同步,包括以下步驟:
對第一路音頻信號和第二路音頻信號,分別讀取N秒鐘的音頻,對兩段音頻進行采樣得到兩組待同步的音頻采樣序列;首先假設兩路音頻信號的延時值為D為D0,D0=0,進入第一級同步,也就是粗同步的過程;
通過假設的延時值D0,移動兩路音頻采樣序列,使其在時間上對齊;然后從兩路音頻采樣序列的同一時間點開始向后各取長度為M的同步測試音頻序列,分別計算這兩路同步測試音頻序列的MEL倒譜特征值,得到兩個同步測試音頻序列的特征值序列;
對假定的延時值D0,減去和加上一個搜索步長S以后,分別得到兩個新的假定延時值D1和D2。在延時值分別為D0、D1和D2時,分別計算這兩個同步測試音頻序列特征值的相關性值L0、L1和L2;
根據所述相關值,判斷下一步搜索方向繼續搜索,一直搜索到確定了最終的取值區間范圍;
在這個區間內,縮小每一次搜索的步長S,也就是進入第二次同步即細同步,細同步的搜索步長小于粗同步;
最后找出具體的滿足條件(相關性大于門限A)的延時值D值;
所述兩路音頻的周期比對包括以下步驟:
定期的對兩路音頻進行音頻信號采樣,計算兩列采樣音頻序列的MEL倒譜特征值,然后比較他們的相關性;如果相關性仍然大于門限A,說明這段時間內兩路音頻還是保持內容一致的。
所述的實時音頻比對方法,其中,所述計算這兩個同步測試音頻序列特征值的相關性值L0、L1和L2包括以下步驟:
以D0為假設延時,對齊所述兩路音頻采樣序列,然后從兩路音頻采樣序列的同一時間點開始向后各取長度為M的同步測試音頻序列,分別計算這兩路同步測試音頻序列的MEL倒譜特征值,得到兩個同步測試音頻序列的特征值序列;計算這兩個特征值序列的相關性值L0。
所述的實時音頻比對方法,其中,所述計算這兩個同步測試音頻序列特征值的相關性值L0、L1和L2包括以下步驟:
假設兩路音頻信號的延時值為?D1=D0–S秒,以D1為延時對齊兩列音頻序列,然后從對齊后的兩路音頻序列的同一時間點處開始向后各取長度為M的音頻采樣序列,分別計算這兩路同步測試音頻序列的MEL倒譜特征值,得到兩個同步測試音頻序列的特征值序列;對這兩個MEL倒譜特征值序列計算相關性得到相關值L1。
所述的實時音頻比對方法,其中,所述計算這兩個同步測試音頻序列特征值的相關性值L0、L1和L2包括以下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京巴越赤石科技有限公司,未經北京巴越赤石科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410814218.0/2.html,轉載請聲明來源鉆瓜專利網。





