[發明專利]盲信號分離方法、裝置和電子設備有效
| 申請號: | 201811045478.0 | 申請日: | 2018-09-07 |
| 公開(公告)號: | CN110890098B | 公開(公告)日: | 2022-05-10 |
| 發明(設計)人: | 胡玉祥;朱長寶 | 申請(專利權)人: | 南京地平線機器人技術有限公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L21/0272 |
| 代理公司: | 北京市正見永申律師事務所 11497 | 代理人: | 黃小臨;馮玉清 |
| 地址: | 210046 江蘇省南京市*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信號 分離 方法 裝置 電子設備 | ||
公開了一種盲信號分離方法、裝置和電子設備。該方法包括:使用復數高斯分布對聲源進行建模,以確定聲源的概率密度分布;基于所述概率密度分布來更新盲信號分離模型;以及,使用更新后的盲信號分離模型對音頻信號進行分離,以獲得多個分離的輸出信號。這樣,可以通過基于復數高斯分布獲得的聲源的概率密度分布更新盲信號分離模型,從而有效地提升盲信號分離算法在特定場景下的分離性能。
技術領域
本申請涉及音頻處理技術,且更為具體地,涉及盲信號分離方法、盲信號分離裝置和電子設備。
背景技術
“雞尾酒會”問題是語音增強系統中極具挑戰性的問題之一,其難點在于要求從包含音樂、車輛噪聲以及其他說話人聲的嘈雜環境中,分離提取期望說話人的語音信號,而人類聽覺系統能夠從這一環境中輕易地提取感興趣的音頻信號。
現有的解決方案是使用盲信號分離系統來模擬人類的聽覺系統,即識別和增強來自特定聲源的聲音。
但是,現有的盲信號分離系統仍存在諸如針對特定場景的適應性的問題。例如,基于多元拉普拉斯分布的盲信號分離算法可以作用于大多數聲信號,并且可以擴展到實時處理場景,但是對于一些有特定頻譜結構的信號,例如具有諧波結構的音樂信號,多元拉普拉斯模型無法很好地描述此類信號。此外,基于諧波模型的盲信號分離算法可以有效地分離語音和音樂的混合信號,但是諧波模型假設分離信號的方差為1,需要白化操作,因此只適用于離線場景,無法擴展到實時處理場景。
因此,仍期望提供改進的盲信號分離方案。
發明內容
為了解決上述技術問題,提出了本申請。本申請的實施例提供了一種盲信號分離方法、裝置和電子設備,其通過基于復數高斯分布獲得的聲源的概率密度分布更新盲信號分離模型,從而有效地提升盲信號分離算法在特定場景下的分離性能。
根據本申請的一個方面,提供了一種盲信號分離方法,包括:使用復數高斯分布對聲源進行建模,以確定聲源的概率密度分布;基于所述概率密度分布來更新盲信號分離模型;以及使用更新后的盲信號分離模型對音頻信號進行分離,以獲得多個分離的輸出信號。
在上述盲信號分離方法中,所述盲信號分離模型的代價函數為:
其中W(k)為第k個頻點的分離模型,yi表示第i個聲源的分離信號,G(yi)為對照函數,其表示為log q(yi),q(yi)是第i個聲源的概率密度分布。
在上述盲信號分離方法中,使用復數高斯分布對聲源進行建模包括離線建模、在線建模、或者二者的組合。
在上述盲信號分離方法中,所述離線建模包括:使用與要分離的音頻信號中的聲源相同類型的聲源的干凈語音信號進行建模,以獲得所述聲源的概率密度分布。
在上述盲信號分離方法中,還包括:基于所獲得的多個分離的輸出信號來更新所述盲信號分離模型。
在上述盲信號分離方法中,所述在線建模包括:對上一幀音頻信號分離得到的多個輸出信號進行建模,以獲得各個聲源的概率密度分布。
在上述盲信號分離方法中,所述離線建模和在線建模的組合包括:對要分離的音頻信號中的部分聲源進行離線建模;以及,對要分離的音頻信號中的其余聲源進行在線建模。
在上述盲信號分離方法中,所述部分聲源是已知聲源,所述其余聲源是未知聲源。
在上述盲信號分離方法中,使用所獲得的盲信號分離模型對音頻信號進行分離包括:將所述音頻信號轉換為頻域信號,以在頻域進行分離,所述多個分離的輸出信號是頻域信號。
在上述盲信號分離方法中,還包括:將所述多個分離的輸出信號中的至少一個轉換為時域信號。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京地平線機器人技術有限公司,未經南京地平線機器人技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811045478.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種石墨炭化系統
- 下一篇:一種血液樣本的分析方法和血液細胞分析儀及存儲介質





