[發明專利]一種音調序列的魯棒階躍規整方法有效
| 申請號: | 201610231868.1 | 申請日: | 2016-04-14 |
| 公開(公告)號: | CN105741857B | 公開(公告)日: | 2019-06-14 |
| 發明(設計)人: | 李玉鑑;時康凱;楊紅麗 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G10L25/90 | 分類號: | G10L25/90;G10L25/03;G10L25/54 |
| 代理公司: | 北京思海天達知識產權代理有限公司 11203 | 代理人: | 沈波 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 音調 序列 階躍 規整 方法 | ||
一種音調序列的魯棒階躍規整方法,用于將不準確的音調值規整到更符合上下文的音調值上,在音調值的確定上有很好的效果。具體過程包括:首選對輸入音頻數字信號提取原始音調序列,然后反復截取長度固定的子音調序列,并映射到規整矩陣中,其次擴展該規整矩陣,構造相應的圖結構,求解其中的路徑以生成路徑關聯矩陣,最后通過分析路徑關聯矩陣找到符合上下文的音調值作為音調校準值。本發明對音調序列規整的目標結果符合實際情況,對聲音音調值的提取也更加準確可靠;對音調序列規整的過程可控,通過自行設定相關參數可以讓規整的過程更加靈活;在音調序列值分散較大的情況仍然會有很好的效果,具備很好的魯棒性。
技術領域
本發明屬于音頻應用技術中音調提取與確定部分。具體內容是應用在提取原始音調序列之后的規整,用于準確提取音調的方法。
背景技術
聲音是由物體振動產生的聲波,也就是模擬信號,計算機要對聲音進行處理,就要對聲音的聲波進行數字化,也就是轉化為數字信號。
模擬信號是一定范圍的電壓信號或電流信號,模擬信號是指信息參數在給定范圍內表現為連續的信號,或在一段連續的時間間隔內,其代表信息的特征量可以在任意瞬間呈現為任意數值的信號,因而計算機無法對模擬信號進行存儲;但是根據香農定理可知,用離線的序列可以完全代表一個連續的函數,所以可以使用離散采樣的方式獲取聲波的值序列,然后通過該值序列還原出模擬信號的波形;要保證采樣后的序列可以完整的還原出原始的波形信息,需要根據奈奎斯特原則:在進行模擬信號轉數字信號的過程中,只有當采樣頻率大于模擬信號最高頻率的2倍時,采樣之后的數字信號能較完整地保留原始信號中的信息。
后文所說的音頻數據即表示采樣之后的聲波值。
人耳的聽力范圍是20~20kHz,所以在實際中采樣的頻率是44.1kHz,高于最高頻率的2倍是為了提高聲波量化的容差性。
聲音波形的頻率高低叫做音調,可以根據相關的公式由聲音波形的頻率求出音調值。
音頻作為一種重要的用來傳遞信息數據,在實際生活中如何對這種大規模的數據進行有效的應用一直是一項重要的研究內容。在音頻應用的相關技術中,音調是音頻一項極為重要的特征屬性,例如在音樂檢索中,只有音調定準之后才能做好一些后續的操作,如音調序列字符化、提取音高曲線等;準確的音調序列可以提高基于內容的音頻檢索的準確率、可以使音頻按照風格或者按照作曲人等信息的聚類更加可信。
當前的音頻的音調序列提取主要是通過短時自相關函數、短時平均幅度差等方法來獲取與原始音頻波形周期一致的中間函數波形,然后再對中間函數波形進行基音周期提取;然而在提取的過程中由于實際音頻的諧波組成多樣以及噪聲的干擾,因此會造成音調提取值的參差不齊,無法確定某一短時間內的準確音調值;
傳統方法在提取音調序列之后用中值平滑算法、線性平滑算法或者動態規劃平滑算法去除音調序列中的異常值,這些方法只對平穩序列中有個別的突變點時奏效;如果序列值存在連續的異常點,值進行平滑算法之后很有可能無法準確識別異常點,還可能會導致異常被放大,造成平滑后的序列仍然波動明顯;本發明介紹的方法可以很好解決這一問題,提取到比較準確的音調值;
在音調值提取準確之后,可以在以下等方面進行應用:
1.在音樂檢索中利用音樂音調值建立準確的索引并進行快速的搜索;
2.通過音樂文件生成對應的樂譜文件,給相關工作提供幫助;
3.通過比較網絡中不同音樂的相似度來對音樂等文件進行版權保護;
4.在音樂軟件中利用音樂聚類方法對用戶進行音樂推薦,提供更好的用戶體驗;
5.提供更加靈活的音樂檢索方式,例如通過人哼唱來進行基于內容的音樂檢索。
發明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610231868.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種三輪車專用防盜鎖
- 下一篇:一種基于音頻分析的乘務員呼喚應答檢測方法





