[發明專利]聲音分離的增強方法及系統有效
| 申請號: | 202110591841.4 | 申請日: | 2021-05-28 |
| 公開(公告)號: | CN113241091B | 公開(公告)日: | 2022-07-12 |
| 發明(設計)人: | 吳夢玥;李光偉;徐薛楠;丁翰林;俞凱 | 申請(專利權)人: | 思必馳科技股份有限公司 |
| 主分類號: | G10L21/0272 | 分類號: | G10L21/0272;G10L21/0208;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京商專永信知識產權代理事務所(普通合伙) 11400 | 代理人: | 黃謙;車江華 |
| 地址: | 215123 江蘇省蘇州市蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲音 分離 增強 方法 系統 | ||
1.一種聲音分離的增強方法,包括:
從給定數量的各類別的弱標簽音頻數據集中,利用第一限制條件,確定各類別的第一有效音頻片段;
利用所述各類別的第一有效音頻片段,訓練通用聲音分離系統;
針對選定的類別的弱標簽音頻數據集,利用第二限制條件,確定所述選定的類別的第二有效音頻片段,其中,所述第二限制條件高于所述第一限制條件;
利用所述選定的類別的所述第二有效音頻片段、以及其他類別的第一有效音頻片段,訓練類別適應增強系統;
利用所述類別適應增強系統對所述選定的類別進行聲音分離,
其中,所述第一限制條件通過基于聲音事件種類的聲音事件檢測模型確定;
所述確定各類別的第一有效音頻片段包括:
將所述弱標簽音頻數據集輸入至所述聲音事件檢測模型;
在所述聲音事件檢測模型中,截取所述弱標簽音頻數據集內各音頻數據中聲音事件最高值的前后預設時間段的音頻,確定為第一有效音頻片段。
2.根據權利要求1所述的方法,其中,所述利用所述各類別的第一有效音頻片段,訓練通用聲音分離系統包括:
將所述各類別的第一有效音頻片段中,不同類別的第一有效音頻片段兩兩組合,對所述通用聲音分離系統進行訓練。
3.根據權利要求1所述的方法,其中,所述第二限制條件通過基于雙閾值分割的聲音事件檢測模型確定。
4.一種聲音分離的增強系統,包括:
第一有效音頻片段確定程序模塊,用于從給定數量的各類別的弱標簽音頻數據集中,利用第一限制條件,確定各類別的第一有效音頻片段;
通用聲音分離系統訓練程序模塊,用于利用所述各類別的第一有效音頻片段,訓練通用聲音分離系統;
第二有效音頻片段確定程序模塊,用于針對選定的類別的弱標簽音頻數據集,利用第二限制條件,確定所述選定的類別的第二有效音頻片段,其中,所述第二限制條件高于所述第一限制條件;
類別適應增強系統訓練程序模塊,用于利用所述選定的類別的所述第二有效音頻片段、以及其他類別的第一有效音頻片段,訓練類別適應增強系統;
聲音分離程序模塊,用于利用所述類別適應增強系統對所述選定的類別進行聲音分離,
其中,所述第一限制條件通過基于聲音事件種類的聲音事件檢測模型確定;
所述第一有效音頻片段確定程序模塊用于:
將所述弱標簽音頻數據集輸入至所述聲音事件檢測模型;
在所述聲音事件檢測模型中,截取所述弱標簽音頻數據集內各音頻數據中聲音事件最高值的前后預設時間段的音頻,確定為第一有效音頻片段。
5.根據權利要求4所述的系統,其中,所述通用聲音分離系統訓練程序模塊用于:
將所述各類別的第一有效音頻片段中,不同類別的第一有效音頻片段兩兩組合,對所述通用聲音分離系統進行訓練。
6.根據權利要求4所述的系統,其中,所述第二限制條件通過基于雙閾值分割的聲音事件檢測模型確定。
7.一種電子設備,其包括:至少一個處理器,以及與所述至少一個處理器通信連接的存儲器,其中,所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行權利要求1-3中任一項所述方法的步驟。
8.一種存儲介質,其上存儲有計算機程序,其特征在于,該計算機程序被處理器執行時實現權利要求1-3中任一項所述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于思必馳科技股份有限公司,未經思必馳科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110591841.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:降板衛生間基層架空構造以及架空構造施工方法
- 下一篇:一種扶手及座椅





