[發明專利]從單音音頻信號分離音頻信源的神經網絡分類器無效
| 申請號: | 200680041405.3 | 申請日: | 2006-10-03 |
| 公開(公告)號: | CN101366078A | 公開(公告)日: | 2009-02-11 |
| 發明(設計)人: | D·V·施穆克 | 申請(專利權)人: | DTS公司 |
| 主分類號: | G10L19/00 | 分類號: | G10L19/00;G10L15/00;G10L21/00;G10L21/04 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 | 代理人: | 馬浩 |
| 地址: | 美國加*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 單音 音頻 信號 分離 信源 神經網絡 分類 | ||
技術領域
本發明涉及下混合到單一單音音頻信號的多個未知音頻信源的分離。
背景技術
存在多種用于從立體或多信道音頻信號提取信源的技術。獨立分量分析(ICA)是最廣泛應用和研究的方法。然而,ICA僅能夠提取等于或小于輸入信號中的信道數目的多個信源。因此,它不能夠用于單音信號分量。
從單音信號提取音頻信源可以用于提取語音信號特征,合成多信道信號表示,對音樂進行分類,跟蹤信源,對ICA產生附加信道,為導航目的(瀏覽)產生音頻索引,以及重新混合(consumer?&pro)安全性和監控、電話和無線通信以及電視會議。已經很好地研究了語音信號特征(諸如自動化語言檢測、自動語音識別、語音/音樂檢測器)的提取。由于包括廣泛變化的信號和信源參數、信源的時域和頻域交疊以及實際生活信號中的混響問題所導致的困難,所以對于從單音信號提取任意樂器信號很少進行研究。已知技術包括均衡和直接參數提取。
均衡器可以應用到信號以提取占據已知頻率范圍的信源。例如,語音信號的大多數能量存在于200Hz-4kHz范圍內。低音電吉他聲音通常限于低于1kHz的頻率。通過對所有帶外信號進行濾波,或者可以提取出選擇的信源,或者它的能量能夠相對于其它信源被放大。然而,對于提取交疊的信源,均衡并不有效。
在Tong?Zhag和Jay?Kuo所著的“Audio?Content?Analysis?forOnline?Audiovisual?Data?Segmentation?and?Classification”(IEEETransactions?on?speech?and?audio?processing,vol.9?No.4,2001年5月)中公開了一種直接參數提取的方法。提取出了諸如能量函數、平均過零率、基頻以及譜峰軌跡的簡單音頻特征。該信號然后被劃分類別(寂靜、帶有音樂成分、不帶有音樂成分)和子類別。基于特征與一組界限的直接比較,將片段包括到某類別中。需要所述信源的先驗知識。
在George?Tzanetakis和Perry?Cook所著的Musical?GenreClassification?of?Audio?Signals”(IEEE?Transactions?on?speech?andaudio?processing,vol.10?No.5,2002年7月)中公開了一種音樂題材分類的方法。從信號中提取出諸如樂器、韻律結構以及諧波分量的特征,并且將這些特征輸入到預訓練統計模式識別分類器中。DonKimbler?and?Lynn?Wilcox所著的“Acoustic?Segmentation?for?AudioBrowsers”采用隱馬爾可夫模型用于音頻分段和分類。
發明內容
本發明能夠對下混合到單一單音音頻信號的任意多個且預先未知的音頻信源進行分離和分類。
這是通過將該單音音頻信號分離成多個基線幀(可能交疊),對這些幀加窗,提取每幀內的多個描述性特征,以及采用預訓練的非線性神經網絡作為分類器來實現的。每個神經網絡輸出表明該單音音頻信號的每個基線幀內的預定類型的音頻信源的存在。通常,神經網絡所具有的輸出數目等于該系統進行訓練以區分的音頻信源的類型數目。該神經網絡分類器非常適于解決廣泛變化的信號和信源參數、信源的時域和頻域交疊以及實際生活信號中的回響和遮擋。該分類器輸出能夠用作前端以形成多個音頻信道用于源分離算法(例如,ICA),或用作后處理算法(例如對音樂分類,跟蹤信源,為導航目的產生音頻索引,以及重新混合安全性和監控、電話和無線通信以及電視會議)的參數。
在第一實施例中,對該單音音頻信號進行子帶濾波。子帶數目以及子帶的變化或均勻性取決于應用。然后,對每個子帶成幀并且提取特征。可以從不同子帶提取出相同或不同的特征組合。一些子帶可以沒有特征被提取。每個子帶特征可以形成對該分類器的獨立輸入,或者相似特征可以在這些子帶上進行“融合”。分類器對于每個預定音頻信源可以包括單個輸出節點,從而提高對每個特定音頻信源進行分類的健壯性。或者,分類器對于每個預定音頻信源的每個子帶可以包括輸出節點,從而改進多個頻率交疊信源的分離。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于DTS公司,未經DTS公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200680041405.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于雙直邊磨邊機去除玻璃兩平面邊框覆膜的加工裝置
- 下一篇:一種即開電開水器





