[發明專利]語音分離方法、裝置、設備和存儲介質在審
| 申請號: | 202111040658.1 | 申請日: | 2021-09-06 |
| 公開(公告)號: | CN113782047A | 公開(公告)日: | 2021-12-10 |
| 發明(設計)人: | 戴瑋;關海欣;梁家恩 | 申請(專利權)人: | 云知聲智能科技股份有限公司 |
| 主分類號: | G10L21/0272 | 分類號: | G10L21/0272;G10L21/0216;G10L21/0224;G01S3/14 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100096 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 分離 方法 裝置 設備 存儲 介質 | ||
本發明涉及一種語音分離方法、裝置、設備和存儲介質,包括對時域的混合語音信號進行分離得到第一通道的時域信號和第二通道的時域信號后,按照信號能量由高到低的順序,選取指定幀數的第一通道的時域信號對應的二維波達方位估計,并求眾數,得到第一通道的方位估計信息,以及,選取指定幀數的第二通道的時域信號對應的二維波達方位估計信息,并求眾數,得到第二通道的方位估計;根據第一通道的方位估計信息,計算第一通道的俯仰角偏差和第一通道的方位角偏差,以及,根據第二通道的方位估計信息,計算第二通道的俯仰角偏差和第二通道的方位角偏差;并得到第一通道與第二通道各偏差的比較結果,根據比較結果,確定每個通道對應的目標聲源。
技術領域
本發明涉及語音處理技術領域,具體涉及一種語音分離方法、裝置、設備和存儲介質。
背景技術
近年來,隨著語音識別技術的飛速發展,多路語音識別場景中對實時語音分離技術提出迫切的技術需求。比如,在一對一教學中需要將學生的語音和老師的語音分離出來。
相關技術中,通常采用盲源分離技術對混合語音進行分離,但盲源分離得到的各語音信號對應的輸出通道順序不確定,需要用戶進一步確定每個通道對應的語音信號,降低了語音分離效率。
發明內容
本發明提供一種語音分離方法、裝置、設備和存儲介質,以解決現有技術中因盲源分離得到的各語音信號對應的輸出通道順序不確定,需要用戶進一步確定每個通道對應的語音信號,降低了語音分離效率的技術問題。
本發明解決上述技術問題的技術方案如下:
一種語音分離方法,包括:
對麥克風陣列接收到的時域的混合語音信號進行傅里葉變換,得到時頻域的混合語音信號;
對所述時頻域的混合語音信號進行分離,得到第一通道的分離信號和第二通道的分離信號;
將所述第一通道的分離信號和第二通道的分離信號分別進行短時傅里葉逆變換,得到第一通道的時域信號和所述第二通道的時域信號;
按照信號能量由高到低的順序,選取指定幀數的第一通道的時域信號對應的二維波達方位估計,并求眾數,得到第一通道的方位估計信息,以及,選取指定幀數的第二通道的時域信號對應的二維波達方位估計信息,并求眾數,得到第二通道的方位估計;
根據所述第一通道的方位估計信息,計算第一通道的俯仰角偏差和第一通道的方位角偏差,以及,根據所述第二通道的方位估計信息,計算第二通道的俯仰角偏差和第二通道的方位角偏差;
若所述第一通道的俯仰角偏差不大于所述第二通道的俯仰角偏差,和/或,第一通道的方位角偏差不大于所述第二通道的方位角偏差,確定所述第一通道為第一目標聲源的語音信息,所述第二通道為第二目標聲源的語音信息;
若所述第一通道的俯仰角偏差大于所述第二通道的俯仰角偏差,且第一通道的方位角偏差大于所述第二通道的方位角偏差,確定所述第一通道為第二目標聲源的語音信息,所述第二通道為第一目標聲源的語音信息。
進一步地,上述所述的語音分離方法中,將所述第一通道的分離信號和第二通道的分離信號分別進行短時傅里葉逆變換,得到第一通道的時域信號和所述第二通道的時域信號之前,還包括:
將所述第一通道的分離信號和所述第二通道的分離信號通過自適應濾波算法進行處理,得到第一通道的初級降噪信號;
將所述第一通道的初步降噪信號與所述時域的混合語音信號進行能量對比,將能量高的語音信號與所述時域的混合語音信號通過自適應濾波算法和非線性降噪算法進行處理,得到第二通道的初級降噪信號;
對應地,將所述第一通道的分離信號和第二通道的分離信號分別進行短時傅里葉逆變換,得到第一通道的時域信號和所述第二通道的時域信號,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于云知聲智能科技股份有限公司,未經云知聲智能科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111040658.1/2.html,轉載請聲明來源鉆瓜專利網。





