[發明專利]一種基于分層可靠度變化趨勢的音頻分割方法有效
| 申請號: | 201610872916.5 | 申請日: | 2016-09-30 |
| 公開(公告)號: | CN106297824B | 公開(公告)日: | 2017-08-01 |
| 發明(設計)人: | 楊新宇;王銀瑞;丁建行;董怡卓;羅晶;楊澤正;王藝蒙;李雨墨 | 申請(專利權)人: | 西安交通大學 |
| 主分類號: | G10L25/45 | 分類號: | G10L25/45;G10L25/27;G10L21/0272 |
| 代理公司: | 西安通大專利代理有限責任公司61200 | 代理人: | 張弘 |
| 地址: | 710049 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 分層 可靠 變化 趨勢 音頻 分割 方法 | ||
1.一種基于分層可靠度變化趨勢的音頻分割方法,其特征在于,包括以下步驟:
1)定長分析窗內基于可靠度變化趨勢的分層跳變點檢測;
定義:xk的可靠度RE(xk)為左右兩段信號在各自模型上的似然對數之和,假設每次分析窗內只有一個跳變點,然后計算窗口內各幀的可靠度,根據可靠度的變化趨勢來檢測分析窗內是否有跳變點;
2)基于定長分析窗內跳變點檢測的音頻分割;
對整個音頻信號特征序列從起始位置加定長分析窗W0,若沒有檢測到跳變點,窗口向后移動Δl距離,0<Δl<Nmin,Nmin為最小窗口Wm的長度;繼續檢測下一區域距離;若檢測到跳變點,得到一個定長分析窗內以顯著度排序的跳變點的序列;將分析窗W0移至具有最大時間上標的跳變點處,繼續檢測下一區域;當定長分析窗遍歷整個歌曲音頻流后,將會得到所有的跳變點的集合CP;然后再將跳變點的集合CP重新按照時間排序,完成對整個音頻流的分割。
2.根據權利要求1所述的一種基于分層可靠度變化趨勢的音頻分割方法,其特征在于,可靠度的變化趨勢是指:
在跳變點xk左側,隨著音頻幀靠近跳變點xk時,可靠度值呈上升趨勢,在跳變點xk右側,隨著音頻幀遠離跳變點xk時,可靠度值呈下降趨勢,而在跳變點xk處,RE(xk)將取得極大值。
3.根據權利要求1所述的一種基于分層可靠度變化趨勢的音頻分割方法,其特征在于,檢測分析窗內是否有跳變點具體步驟為:
若未檢測到跳變點,表明該窗口中不含跳變點;若檢測到跳變點SP1,則以SP1為界,將W0切分為兩個子窗W1與W2,然后再按照上述流程檢測子窗W1與W2中是否包含跳變點,若未檢測到跳變點,則不再切分窗口,認為其中不包含跳變點;若檢測到跳變點,則以跳變點為界將子窗一分為二繼續檢測下一層子窗,直至子窗長度小于最小窗口長度Nmin或子窗內不包含跳變點。
4.根據權利要求1所述的一種基于分層可靠度變化趨勢的音頻分割方法,其特征在于,步驟1)具體為:
(i)按幀提取音頻特征,確定最大窗口W0的長度為Nmax、最小窗口Wm的長度為Nmin;
(ii)計算分析窗內各幀的可靠度,選取可靠度最大的第k幀作為預選擇跳變點,分析窗內始末段NM幀的可靠度不計算,0<NM<Nmin;根據預選擇跳變點左右兩側可靠度的變化趨勢來確定其是否為真實跳變點,即:
其中,IncNumL(k)是第k幀左側可靠度上升的次數,NumL是第k幀左側的幀數,SumIncREL(k)是第k幀左側可靠度的增加量,SumDecREL(k)是第k幀左側可靠度的減少量,DecNumR(k)是第k幀右側可靠度下降的次數,NumR是第k幀右側的幀數,SumIncRER(k)是第k幀右側可靠度的增加量,SumDecRER(k)是第k幀右側可靠度的減少量,α是音頻幀數百分比;
(iii)若(2)不成立,則窗內不包含跳變點;
(iv)若(2)成立,則預選擇跳變點第k幀為真實跳變點,并將跳變點放入跳變點集合,然后以跳變點為界,將窗口一分為二分割成兩個子窗;判斷子窗是否長度小于最小窗口長度,小于最小窗口長度的不予處理,大于最小窗口長度的子窗執行(ii)步驟,若(2)不成立,不再切分窗口;若(2)成立,跳到(iv)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學,未經西安交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610872916.5/1.html,轉載請聲明來源鉆瓜專利網。





