[發明專利]一種語音分離方法及系統有效
| 申請號: | 201811430304.6 | 申請日: | 2018-11-28 |
| 公開(公告)號: | CN109326303B | 公開(公告)日: | 2021-12-24 |
| 發明(設計)人: | 崔穎 | 申請(專利權)人: | 廣東小天才科技有限公司 |
| 主分類號: | G10L21/0272 | 分類號: | G10L21/0272;G10L17/00 |
| 代理公司: | 上海碩力知識產權代理事務所(普通合伙) 31251 | 代理人: | 郭桂峰 |
| 地址: | 523851 廣東省東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 分離 方法 系統 | ||
本發明提供了一種語音分離方法及系統,其方法包括:獲取用戶聲音的基本波形以及對應的用戶信息,根據所述基本波形和所述用戶信息建立基本波形庫;獲取多人混合語音;將所述多人混合語音和所述基本波形庫進行匹配,將所述多人混合語音分離為多個單人語音。本發明從一個多人混合語音中分離出每個用戶各自產生的單人語音,從而便于用戶對單人語音進行處理。
技術領域
本發明涉及語音識別技術領域,尤指一種語音分離方法及系統。
背景技術
用戶在使用家教機朗讀工具的時候,點擊開始朗讀進行錄音,直至朗讀結束進行回放,但是此過程中沒有對收集回來的音頻信息進行任何的處理,回放的時候是多種聲音混合的效果。在課堂上、課后,學生們喜歡一起大聲朗讀,此時朗讀錄音,家教機接收的是來自不同用戶的聲音,朗讀回放的時候也會呈現多個用戶同時朗讀合成的混雜的聲音,無法辨別單個用戶朗讀的準確性。因此,急需一種對混合的語音進行分離的方法及系統。
發明內容
本發明的目的是提供一種語音分離方法及系統,實現從一個多人混合語音中分離出每個用戶各自產生的單人語音,從而便于用戶對單人語音進行處理。
本發明提供的技術方案如下:
本發明提供一種語音分離方法,包括:
獲取用戶聲音的基本波形以及對應的用戶信息,根據所述基本波形和所述用戶信息建立基本波形庫;
獲取多人混合語音;
將所述多人混合語音和所述基本波形庫進行匹配,將所述多人混合語音分離為多個單人語音。
進一步的,所述的獲取用戶聲音的基本波形以及對應的用戶信息,根據所述基本波形和所述用戶信息建立所述基本波形庫具體包括:
獲取用戶語音以及對應的用戶信息;
分析所述用戶語音,得到對應的用戶的聲音的基本波形;
根據所述基本波形和所述用戶信息建立所述基本波形庫,在所述基本波形庫建立所述基本波形和所述用戶信息之間的映射關系。
進一步的,所述的將所述多人混合語音和所述基本波形庫進行匹配,將所述多人混合語音分離為多個單人語音具體包括:
根據所述多人混合語音得到對應的混合語音波形;
將所述混合語音波形和所述基本波形庫進行匹配,將所述多人混合語音分離為多個單人語音。
進一步的,還包括:
獲取所述多人混合語音對應的混合語音用戶信息,得到所述多人混合語音中包含的人數;
統計分離出的所述單人語音的個數;
當所述個數小于所述人數時,根據所述基本波形庫獲取將所述單人語音對應的單人語音用戶信息;
將所述單人語音用戶信息和所述混合語音用戶信息進行對比,獲取所述多人混合語音中未分離的語音對應的未分離語音用戶信息;
根據所述未分離語音用戶信息獲取對應的未分離語音基本波形;
根據所述未分離語音基本波形和對應的所述未分離語音用戶信息更新所述基本波形庫;
根據所述未分離語音基本波形分離所述多人混合語音。
進一步的,所述的將所述多人混合語音和所述基本波形庫進行匹配,將所述多人混合語音分離為多個單人語音之后包括:
將所述用戶信息作為標記信息標記對應的所述單人語音;
根據所述標記信息存儲所述單人語音;
根據存儲的所述單人語音分析對應的用戶的語音質量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東小天才科技有限公司,未經廣東小天才科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811430304.6/2.html,轉載請聲明來源鉆瓜專利網。





