[發明專利]基于音頻特征的歌曲智能識別方法有效
| 申請號: | 201110285850.7 | 申請日: | 2011-09-23 |
| 公開(公告)號: | CN102332262A | 公開(公告)日: | 2012-01-25 |
| 發明(設計)人: | 張欽宇;林威;梁玉鋒;李云鶴;卜磊;潘振鵬 | 申請(專利權)人: | 哈爾濱工業大學深圳研究生院 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02 |
| 代理公司: | 深圳市科吉華烽知識產權事務所 44248 | 代理人: | 胡吉科 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 音頻 特征 歌曲 智能 識別 方法 | ||
技術領域
本發明涉及歌曲或樂曲的識別。
背景技術
傳統的音頻特征常用來識別字、詞、說話人和場景識別,比如:
(1)連續語音識別系統,把輸入的語流切分為小的片段,在識別前先把各字分開,識別單詞之間的邊界。整個識別系統分為三層:聲學-語音層、詞層和句法層。采用隱式馬爾可夫模型框架,將各層次組成一個統一的結構。
(2)基于內容的音頻檢索,通過反復重復一個歌曲的曲調,可以將歌曲的曲調片段從一系列音頻信號中檢索出來。
(3)嵌入式語音識別系統
在嵌入式平臺實現的特定人孤立詞語音識別系統。特定人語音識別系統可以對孤立詞匯進行聲學建模,識別采用動態時間歸整等匹配算法,對小詞匯量識別實現效果比較理想。
盡管傳統音頻特征可以被用來識別字詞和語句曲調,但在用來識別歌曲音樂的時候,也存在一些問題或缺陷:
例如利用連續語音識別系統進行歌曲識別。由于歌詞速度不固定,時快時慢,對歌曲內容進行分割建立單詞之間的邊界是非常困難的。盡管有時可以采用能量最低點作為邊界,但通常還要根據發音信息加以驗證。利用Mel頻率倒譜系數為特征以及一個樹形結構的分類器進行分類的方法,可以實現對音樂和聲音的檢索,但該方法對音樂和環境聲音分類效果不夠好。另外目前在嵌入式平臺實現的主要是對系統的運算資源和存儲資源要求比較低的特定人孤立詞語音識別系統。
綜上,現有音頻特征識別系統實現方案主要針對說話語音語義進行識別,在歌曲識別方面要么不能進行有效的識別,要么帶有一些局限性。本發明的目的在于設計出一種高性能高識別率的歌曲識別方案,實現起來比較靈活又具有良好的模塊化和可擴展性。
發明內容
為了解決現有技術中問題,本發明提供了一種基于音頻特征的歌曲智能識別方法,其包括以下步驟:?
(1)服務器對歌曲建立音頻特征庫;
(2)在客戶端設置好采樣率,對外界歌曲進行錄音t秒時間以上;
(3)然后采用特定的音頻特征提取算法提取該段音頻的特征值;
(4)處理完畢后,將音頻特征參數通過網絡上傳到服務器;
(5)在接受到待匹配的特征值后開始采用匹配算法進行相似度匹配;
(6)匹配成功則將歌曲的原信息如歌曲名稱、歌手、專輯名稱等發送到客戶端;匹配失敗則反饋匹配失敗的信息。
作為本發明的進一步改進,?所述步驟(1)中,服務器對歌曲建立音頻特征庫,具體如下:將音頻數據流進行采樣、分幀,假設分為x幀,通過對每幀PCM數據提取一個y位的0/1值作為特征,共提取y×x個特征值。Pulse?Code?Modulation----脈碼調制錄音,?所謂PCM錄音就是將聲音等模擬信號變成符號化的脈沖列,再予以記錄。
作為本發明的進一步改進,所述步驟(3)中具體操作如下:以一定的采樣頻率采集t秒的音頻流得到PCM數據,對PCM數據分幀,設按N個采樣點劃分為一幀,對每一幀的采樣點進行快速傅里葉變換,設每一幀采樣點x?(0),?x?(1),?…,?x(N-1)經過快速傅里葉變換得到了一串頻域幅值X(0),?X(1),?…?,X(N-1),其中
,,
為了提取y位的音頻特征,把快速傅里葉變換之后的N個頻域幅值,按照所在頻帶平均分成y+1等份,?
計算每等份頻帶內各個頻域值的絕對值的和S,用S(n,m)表示第n幀第m個等份頻帶所有頻域幅值的和值,用F(n,m)表示第n幀第m個等份頻帶的特征值,則:
其中,,
這樣,每個音頻幀共提取y個特征值,x為音頻段的總幀數,這樣整個音頻流共采集了y?×?x個特征值。
作為本發明的進一步改進,數字錄音裝置的采樣頻率為44.1kHz。
作為本發明的進一步改進,頻域幅值的頻率范圍為和人的聽覺感知最相關的300Hz~22000Hz。
作為本發明的進一步改進,步驟(5)中匹配方法如下:
將音頻流的y?×?x特征值組成y?×?x維特征向量A,用這個特征向量與歌曲特征庫中已經事先提取保存的特征向量B進行匹配,判斷是否是同一首歌曲,匹配采用計算向量余弦夾角的方法:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學深圳研究生院,未經哈爾濱工業大學深圳研究生院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110285850.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種FED用紅色發光熒光粉及其制備方法
- 下一篇:具有車輛的設備





