[發明專利]一種音調序列的魯棒階躍規整方法有效
| 申請號: | 201610231868.1 | 申請日: | 2016-04-14 |
| 公開(公告)號: | CN105741857B | 公開(公告)日: | 2019-06-14 |
| 發明(設計)人: | 李玉鑑;時康凱;楊紅麗 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G10L25/90 | 分類號: | G10L25/90;G10L25/03;G10L25/54 |
| 代理公司: | 北京思海天達知識產權代理有限公司 11203 | 代理人: | 沈波 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 音調 序列 階躍 規整 方法 | ||
1.一種音調序列的魯棒階躍規整方法,其特征在于:
本方法包括以下步驟:
S1對輸入長度為t的音頻數字信號x1,x2,…,xt提取原始音調序列:
a)設置數字信號的幀長度為L,把信號劃分為個不重疊的數據幀;
b)對每一幀音頻信號,利用短時平均幅度差函數或短時自相關函數或加權短時自相關函數方法計算出與原始音頻信號波形具有相同周期的中間函數波形;
c)提取中間函數波形的極值點序列K1,K2,…,Ku,及相應的位置點序列P1,P2,…,Pu,u為極值點個數兼位置點個數;
d)利用極值點序列計算中間函數波形的頻率f,設定n的初值為2,具體步驟如下:
i.按順序取第1到n個極值點構成極值向量a,取第n+1到2·n個極值點構成極值向量b;
ii.利用公式計算a,b之間的余弦相似度;
iii.把n增加2,重復步驟i到iii直到n大于u/2;
iv.把sim2,sim4,…,simn從大到小排列,取出所有simn大于Δ的n值,求這些n值兩兩之間的最大公約數d,取出現次數最多的公約數D,作為波形信號每個周期中最可能包含的極值點個數;
v.根據公約數D、極值點序列K1,K2,…,Ku和位置點序列P1,P2,…,Pu,從P1開始計算包含D個極值點的時間區間,作為周期值period,并計算出頻率f=1/period;
e)利用頻率值f和公式Semitone=log2(f/440)*12+69計算每一幀信號的音調值;
f)將所有計算得到的音調值記為T1,T2,…,Ts,該序列就是原始音調序列;
S2設置音調持續的最短時間閾值H;利用音頻采樣率Q,計算該時間閾值內音調值的個數N,具體計算公式是:
S3輸入需要校準規整的音調序列T1,T2,…,Ts,設置移位偏移量i初值為N+1;
S4構造一個(2·N+1)×(2·N+1)的規整矩陣M,具體步驟如下:
g)在T1,T2,…,Ts中以Ti為中心截取Ti及左右兩邊各N個音調值,組成序列S1,S2,…,S2·N+1,并置規整矩陣M為全0矩陣;
h)找到S1,S2,…,S2·N+1的最大值MAX與最小值MIN;
i)計算以及第row行的參考值SCALErow=MAX-(row-1)·λ,row=1,2,…,2·N+1;
j)對每一個元素Sc,c=1,2,…,2·N+1,找到和Sm最接近的參考值SCALEr,令M的第r行第c列元素值為1,即Mr,c=1;
S5利用規整矩陣M構造兩個與之完全相同的矩陣EM,XM;用EMp,q代表矩陣EM第p行第q列的元素,用XMp,q代表矩陣XM第p行第q列的元素;
S6對EM進行擴展操作:對任意XMp,q,當XMp,q為1時,令EMp,q-1和EMp,q+1為1;
S7將矩陣EM轉換成無向圖G=<V,E>,具體步驟如下:
k)無向圖G的頂點集V由EM中EMp,q=1的元素構成;
l)無向圖G的邊集E由所有EMp,q=1和EMp-1,q=1的頂點對,EMp,q=1和EMp+1,q的頂點對,以及EMp,q=1和EMp,q+1的頂點對構成;
m)把圖G的頂點集分為2·N+1層,第q層記作Yq,由EM中所有EMp,q=1的元素構成;S8在圖G中求解由第1層到2·N+1層的路徑:若路徑不存在,則需要將矩陣EM值賦給矩陣XM,并跳轉到S6執行;若路徑存在,則對規整矩陣M構造路徑關聯集合PS,具體構造步驟如下:
n)在圖G中找到包含該路徑的連通分支PC;
o)對連通分支PC中的任意元素EMp,q,如果Mp,q=1,則將Mp,q添加到集合PS中;
S9統計PS中每一個元素Mp,q的p值,取出現次數最多的p值記為R,當多個p值出現次數均為最多時,R取最小的p值;把和第R行的參考值SCALER相差最小的音調值Sj作為當前音調值Ti的校準值,記作TWi=Sj;
S10把i值增加1,當i<L-N時,重復S4~S9,直到把輸入的音調序列每個值都規整完畢;
S11將音調校準值序列TW1,TW2,…,TWs賦給T1,T2,…,Ts。
S12循環執行S3~S11共N次,最終得到的輸出值序列T1,T2,…,Ts即為最終的校準值序列;
1>Δ>0.80;0.01秒<H<1.00秒。
2.根據權利要求1所述的一種音調序列的魯棒階躍規整方法,其特征在于:當N=2,截取的音調序列S1,S2,S3,S4,S5為Ti-2,Ti-1,Ti,Ti+1,Ti+2,即S1=Ti-2。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610231868.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種三輪車專用防盜鎖
- 下一篇:一種基于音頻分析的乘務員呼喚應答檢測方法





