[發明專利]一種語音分離方法及系統有效

申請號：	201811430304.6	申請日：	2018-11-28
公開（公告）號：	CN109326303B	公開（公告）日：	2021-12-24
發明（設計）人：	崔穎	申請（專利權）人：	廣東小天才科技有限公司
主分類號：	G10L21/0272	分類號：	G10L21/0272;G10L17/00
代理公司：	上海碩力知識產權代理事務所(普通合伙) 31251	代理人：	郭桂峰
地址：	523851 廣東省東***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種語音分離方法系統
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明提供了一種語音分離方法及系統，其方法包括：獲取用戶聲音的基本波形以及對應的用戶信息，根據所述基本波形和所述用戶信息建立基本波形庫；獲取多人混合語音；將所述多人混合語音和所述基本波形庫進行匹配，將所述多人混合語音分離為多個單人語音。本發明從一個多人混合語音中分離出每個用戶各自產生的單人語音，從而便于用戶對單人語音進行處理。

技術領域

本發明涉及語音識別技術領域，尤指一種語音分離方法及系統。

背景技術

用戶在使用家教機朗讀工具的時候，點擊開始朗讀進行錄音，直至朗讀結束進行回放，但是此過程中沒有對收集回來的音頻信息進行任何的處理，回放的時候是多種聲音混合的效果。在課堂上、課后，學生們喜歡一起大聲朗讀，此時朗讀錄音，家教機接收的是來自不同用戶的聲音，朗讀回放的時候也會呈現多個用戶同時朗讀合成的混雜的聲音，無法辨別單個用戶朗讀的準確性。因此，急需一種對混合的語音進行分離的方法及系統。

發明內容

本發明的目的是提供一種語音分離方法及系統，實現從一個多人混合語音中分離出每個用戶各自產生的單人語音，從而便于用戶對單人語音進行處理。

本發明提供的技術方案如下：

本發明提供一種語音分離方法，包括：

獲取用戶聲音的基本波形以及對應的用戶信息，根據所述基本波形和所述用戶信息建立基本波形庫；

獲取多人混合語音；

將所述多人混合語音和所述基本波形庫進行匹配，將所述多人混合語音分離為多個單人語音。

進一步的，所述的獲取用戶聲音的基本波形以及對應的用戶信息，根據所述基本波形和所述用戶信息建立所述基本波形庫具體包括：

獲取用戶語音以及對應的用戶信息；

分析所述用戶語音，得到對應的用戶的聲音的基本波形；

根據所述基本波形和所述用戶信息建立所述基本波形庫，在所述基本波形庫建立所述基本波形和所述用戶信息之間的映射關系。

進一步的，所述的將所述多人混合語音和所述基本波形庫進行匹配，將所述多人混合語音分離為多個單人語音具體包括：

根據所述多人混合語音得到對應的混合語音波形；

將所述混合語音波形和所述基本波形庫進行匹配，將所述多人混合語音分離為多個單人語音。

進一步的，還包括：

獲取所述多人混合語音對應的混合語音用戶信息，得到所述多人混合語音中包含的人數；

統計分離出的所述單人語音的個數；

當所述個數小于所述人數時，根據所述基本波形庫獲取將所述單人語音對應的單人語音用戶信息；

將所述單人語音用戶信息和所述混合語音用戶信息進行對比，獲取所述多人混合語音中未分離的語音對應的未分離語音用戶信息；

根據所述未分離語音用戶信息獲取對應的未分離語音基本波形；

根據所述未分離語音基本波形和對應的所述未分離語音用戶信息更新所述基本波形庫；

根據所述未分離語音基本波形分離所述多人混合語音。

進一步的，所述的將所述多人混合語音和所述基本波形庫進行匹配，將所述多人混合語音分離為多個單人語音之后包括：

將所述用戶信息作為標記信息標記對應的所述單人語音；

根據所述標記信息存儲所述單人語音；

根據存儲的所述單人語音分析對應的用戶的語音質量。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于廣東小天才科技有限公司，未經廣東小天才科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201811430304.6/2.html，轉載請聲明來源鉆瓜專利網。

上一篇：一種基于聲紋比對和生成對抗網絡的語音增強方法
下一篇：一種批量測試語音識別和文本合成的方法和測試系統

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L21-00 為了改變語音信號的質量或其可識度而處理語音信號，以產生另一種可聽的或非可聽的信號，例如視覺信號或觸覺信號
G10L21-02 .語音增強，例如降低噪聲或消除回聲
G10L21-04 .時間壓縮或擴展
G10L21-06 .將語音轉換成非可聽表達形式，例如語音可視化、觸覺輔助的語音處理

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】