[發(fā)明專利]語音分離方法、裝置、介質和設備有效
| 申請?zhí)枺?/td> | 201910735350.5 | 申請日: | 2019-08-09 |
| 公開(公告)號: | CN110428852B | 公開(公告)日: | 2021-07-16 |
| 發(fā)明(設計)人: | 向騰;盧晶 | 申請(專利權)人: | 南京人工智能高等研究院有限公司 |
| 主分類號: | G10L21/0272 | 分類號: | G10L21/0272 |
| 代理公司: | 北京思源智匯知識產(chǎn)權代理有限公司 11657 | 代理人: | 毛麗琴 |
| 地址: | 210046 江蘇省南京市棲霞區(qū)*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 分離 方法 裝置 介質 設備 | ||
公開了一種語音分離方法、裝置、介質和設備。其中的方法包括:獲取待處理時頻域混合信號;對所述待處理時頻域混合信號進行語音分離處理,并根據(jù)所述語音分離處理的結果,獲得所述待處理時頻域混合信號的期望信號方差;根據(jù)所述待處理時頻域混合信號的期望信號方差,對所述待處理時頻域混合信號進行去混響處理,獲得去混響后的時頻域混合信號;根據(jù)所述去混響后的時頻域混合信號,獲得各聲源的時頻域信號。本公開提供的技術方案有利于針對微型雙傳聲器實現(xiàn)高混響環(huán)境下的在線語音分離,有利于提高語音分離的準確性,并有利于保證語音分離的實時性。
技術領域
本公開涉及語音處理技術,尤其是一種語音分離方法、語音分離裝置、存儲介質以及電子設備。
背景技術
語音分離技術可以從由多個聲源混合信號中提取出初始聲源信號,從而實現(xiàn)對期望信號的增強。目前,語音分離技術已被使用于智能家居系統(tǒng)、視頻會議系統(tǒng)以及語音識別系統(tǒng)等多種應用中。
現(xiàn)有的語音分離算法的性能在混響環(huán)境下,通常會有大幅度的下降。如何在混響環(huán)境下,保證語音分離算法的性能,且不帶來計算量的大幅增加,以保證語音分離的實時性,是一個值得關注的技術問題。
發(fā)明內(nèi)容
為了解決上述技術問題,提出了本公開。本公開的實施例提供了一種語音分離方法、裝置、存儲介質和電子設備。
根據(jù)本公開實施例的一個方面,提供一種語音分離方法,包括:獲取待處理時頻域混合信號;對所述待處理時頻域混合信號進行語音分離處理;根據(jù)所述語音分離處理的結果,獲得所述待處理時頻域混合信號的期望信號方差;根據(jù)所述期望信號方差,對所述待處理時頻域混合信號進行去混響處理,獲得去混響后的時頻域混合信號;根據(jù)所述去混響后的時頻域混合信號,獲得各聲源的時頻域信號。
根據(jù)本公開實施例的另一個方面,提供一種語音分離裝置,該裝置包括:獲取混合信號模塊,用于獲取待處理時頻域混合信號;獲取信號方差模塊,用于對所述獲取混合信號模塊獲得的待處理時頻域混合信號進行語音分離處理,并根據(jù)所述語音分離處理的結果,獲得所述待處理時頻域混合信號的期望信號方差;去混響處理模塊,用于根據(jù)所述獲取信號方差模塊獲得的期望信號方差,對所述待處理時頻域混合信號進行去混響處理,獲得去混響后的時頻域混合信號;聲源分離模塊,用于根據(jù)所述去混響處理模塊獲得的去混響后的時頻域混合信號,獲得各聲源的時頻域信號。
根據(jù)本公開實施例的再一方面,提供了一種計算機可讀存儲介質,所述存儲介質存儲有計算機程序,所述計算機程序用于執(zhí)行上述語音分離方法。
根據(jù)本公開實施例的又一方面,提供了一種電子設備,該電子設備包括:處理器;用于存儲所述處理器可執(zhí)行指令的存儲器;所述處理器,用于從所述存儲器中讀取所述可執(zhí)行指令,并執(zhí)行所述指令以實現(xiàn)上述語音分離方法。
基于本公開上述實施例提供的一種語音分離方法和裝置,通過先利用語音分離處理,獲得待處理時頻域混合信號的期望信號方差,并利用待處理時頻域混合信號的期望信號方差進行去混響處理,在有利于提高去混響處理效果的同時,有利于避免增加去混響處理的計算量;通過利用去混響后的時頻域混合信號,獲得各聲源的時頻域信號,有利于保證最終獲得的各聲源的時頻域信號的準確性。由此可知,本公開提供的技術方案有利于針對微型雙傳聲器實現(xiàn)高混響環(huán)境下的在線語音分離,有利于提高語音分離的準確性,并有利于保證語音分離的實時性。
下面通過附圖和實施例,對本公開的技術方案做進一步的詳細描述。
附圖說明
構成說明書的一部分的附圖描述了本公開的實施例,并且連同描述一起用于解釋本公開的原理。
參照附圖,根據(jù)下面的詳細描述,可以更加清楚地理解本公開,其中:
圖1為本公開所適用的一個場景示意圖;
圖2為本公開的語音分離方法一個實施例的流程示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京人工智能高等研究院有限公司,未經(jīng)南京人工智能高等研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910735350.5/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





