[發明專利]一種音頻信號相似程度的自動檢測方法及其系統有效
| 申請號: | 201810445754.6 | 申請日: | 2018-05-11 |
| 公開(公告)號: | CN108665903B | 公開(公告)日: | 2021-04-30 |
| 發明(設計)人: | 李偉;吳益明;陳軻 | 申請(專利權)人: | 復旦大學 |
| 主分類號: | G10L19/02 | 分類號: | G10L19/02;G10L25/51;G06F21/10 |
| 代理公司: | 上海正旦專利代理有限公司 31200 | 代理人: | 陸飛;陸尤 |
| 地址: | 200433 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 音頻 信號 相似 程度 自動檢測 方法 及其 系統 | ||
1.一種音頻信號相似程度的自動檢測方法,其特征在于,包括:
獲取待檢測的兩段音頻信號;
對所述兩段音頻信號進行頻域分析后,找出所有的頻域能量峰值位置;
連接相鄰音頻幀的所述頻域能量峰值,組成音高軌跡;
根據所述的頻域能量峰值位置,計算所述音頻信號中每個音頻幀的顯著值,得到所述音頻信號軌跡的顯著平均值;
根據所述音頻信號軌跡的顯著平均值計算所述音高軌跡的有聲部分判斷的閾值;
去除所述音頻信號軌跡顯著平均值超出所述閾值的部分,得到所述兩段音頻信號的主旋律序列;在任意時間點若仍存在兩個以上的音高軌跡,則選擇顯著值平均值最高的軌跡作為主旋律軌跡,其余軌跡被去除,剩下的音高軌跡即為主旋律軌跡,為了比較相似性,將抽象主旋律序列,而只留下主旋律的整體進行,抽象化方法將每個頻率值映射到一個音高類,并且使用直方圖的形式獲得音高的分布,每個音高被映射到一個八度以內的36個音高類,每個音高類覆蓋了1/3個半音,通過這個過程可以得到一個36維向量的序列,每個向量代表了在大約半秒的時間內主旋律音高的分布;
求出所述兩段主旋律的相似性矩陣;
對所述相似性矩陣應用動態規劃局部規整算法做二值化處理,得到二值矩陣;將前面的提取參數整合到動態規劃規整算法的計算上,將原本算法中比較的參數替換成在特征提取和抽象表示后的關于二值相似性矩陣的計算,該矩陣能夠精準地表示每一個音頻幀之間的相似性;
根據所述二值矩陣來判斷所述兩段輸入音頻信號的相似程度。
2.根據權利要求1所述的方法,其特征在于,所述對所述兩段音頻信號進行頻域分析后,找出所有的頻域能量峰值位置,具體包括:
對輸入的音頻信號進行等響濾波處理后,采用公式:
l=0,1,...and k=0,1,...,N-1
對濾波后的音頻信號進行短時傅里葉變換,并對結果取模得到所述輸入音頻信號的頻域幅度值;
其中,x(n)是音頻信號的時間序列,w(n)是窗函數,l是幀號,M是窗的長度,N表示快速傅里葉變換長度,H是滑窗的步長;
從所述頻域能量值|xl(k)|中,使用峰值提取算法找出所有幅度局部峰值位置pi。
3.根據權利要求1所述的方法,其特征在于,根據所述的頻域幅度峰值位置,計算所述音頻信號中每個音頻幀對應頻域的顯著值,得到所述音頻信號軌跡的顯著平均值,具體包括:
采用公式
根據所述能量峰值位置計算顯著性函數,并得到所述音頻信號軌跡的顯著平均值;
其中,β是能量壓縮參數,是能量閾值函數,是權值函數,為頻率,為能量,能量閾值函數定義為:
其中,是該頻譜幀中頻率能量的最高值,γ代表與所允許的能量差值,單位為dB;權值函數定義了當所述能量峰值位置pi被視為第h個泛音時被賦予的權值,具體定義為:
其中,指對應的音高類與b的音高,是調整權值的參數。
4.根據權利要求1所述的方法,其特征在于,所述根據所述音頻信號軌跡的顯著平均值計算所述音高軌跡的有聲部分判斷的閾值,具體包括:
采用公式
計算所述音高軌跡的有聲部分判斷的閾值;
其中,為所述音頻信號軌跡的顯著平均值,為方差。
5.根據權利要求1所述的方法,其特征在于,所述去除所述音頻信號軌跡顯著平均值超出所述閾值的部分,得到所述兩段音頻信號的主旋律序列,具體包括:判斷所述顯著值平均值是否高于或等于所述閾值,如果是,則將對應的音頻信號軌跡視為主旋律區域的音高軌跡,予以保留;如果否,進一步判斷所述顯著值平均值是否包含顫音的軌跡以及方差是否超過40,如果是,則保留對應的音高軌跡,如果否,則將對應的音頻信號軌跡視為非旋律區域的音高軌跡,做去除處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于復旦大學,未經復旦大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810445754.6/1.html,轉載請聲明來源鉆瓜專利網。





