[發(fā)明專利]數(shù)據(jù)建庫的人聲分離方法、裝置、終端及可讀存儲介質有效
| 申請?zhí)枺?/td> | 201911099096.0 | 申請日: | 2019-11-11 |
| 公開(公告)號: | CN110827849B | 公開(公告)日: | 2022-07-26 |
| 發(fā)明(設計)人: | 陳昊亮;許敏強;楊世清 | 申請(專利權)人: | 廣州國音智能科技有限公司 |
| 主分類號: | G10L21/0272 | 分類號: | G10L21/0272;G10L25/27 |
| 代理公司: | 深圳市世紀恒程知識產(chǎn)權代理事務所 44287 | 代理人: | 晏波 |
| 地址: | 510000 廣東省廣州市黃埔*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數(shù)據(jù) 人聲 分離 方法 裝置 終端 可讀 存儲 介質 | ||
本發(fā)明公開了一種數(shù)據(jù)建庫的人聲分離方法,檢測原始語音是否存在多人混音,若所述原始語音存在多人混音,對所述原始語音進行降噪處理,得到第一多人聲語音,將所述第一多人聲語音按時序分成若干個預設時長的語音片段,提取所述語音片段中的第一單人聲語音,并提取各所述語音片段中剩余的第二多人聲語音,將所述第一單人聲語音的頻率作為篩選頻率,以獲取第二單人聲語音,剔除所述第二單人聲語音得到第三多人聲語音,使用預設二分算法分離所述第三多人聲語音得到第三單人聲語音,將所有單人聲語音存入語音數(shù)據(jù)庫中。本發(fā)明還公開了一種裝置、終端及可讀存儲介質。提高了語音會議記錄處理效率,降低了語音會議記錄處理的誤差。
技術領域
本發(fā)明涉及人聲分離技術領域,尤其涉及數(shù)據(jù)建庫的人聲分離方法、裝置、終端及可讀存儲介質。
背景技術
當前會議記錄有很多形式,比如語音,以便進行會議回顧。但是,會議過程中會有如討論、爭論等情形,這種多人同時講話加上其他噪聲,給后期的人工處理語音會議記錄,也就是將參會人員所說的內(nèi)容分別記錄帶來了巨大的難度,需要花費大量的時間來處理,而計算機又難以將參會人員所說的內(nèi)容分開記錄,并且由于人的主觀性,會導致處理語音會議記錄時出現(xiàn)誤差,造成了語音會議記錄處理效率低、誤差大的問題。
發(fā)明內(nèi)容
本發(fā)明的主要目的在于提供一種涉及數(shù)據(jù)建庫的人聲分離方法、裝置、終端及可讀存儲介質,旨在解決語音會議記錄處理過程中出現(xiàn)的效率低、誤差大的技術問題。
為實現(xiàn)上述目的,本發(fā)明提供一種數(shù)據(jù)建庫的人聲分離方法,所述數(shù)據(jù)建庫的人聲分離方法包括:
檢測待處理的原始語音是否存在多人混音,若所述原始語音存在多人混音,對所述原始語音進行降噪處理,得到第一多人聲語音,其中,所述多人聲語音為包含單人聲和多人混音或只包含多人混音的語音;
將所述第一多人聲語音按時序分成若干個預設時長的語音片段;
提取各所述語音片段中存在的單人聲語音,以作為第一單人聲語音,并提取各所述語音片段中剩余的第二多人聲語音,其中,所述單人聲語音為只包含一種人聲的語音;
將所述第一單人聲語音的頻率作為篩選頻率,獲取所述第二多人聲語音中語音頻率與所述篩選頻率相同的第二單人聲語音;
剔除所述第二多人聲語音中的所述第二單人聲語音得到第三多人聲語音;
使用預設二分算法在預設初始頻率區(qū)間內(nèi)將所述第三多人聲語音進行分離,得到第三單人聲語音;
將所述第一單人聲語音、所述第二單人聲語音和所述第三單人聲語音存入語音數(shù)據(jù)庫中。
可選地,所述使用預設二分算法在預設初始頻率區(qū)間內(nèi)將所述第三多人聲語音進行分離,得到第三單人聲語音的步驟包括:
確定預設初始頻率區(qū)間,基于預設二分算法,將所述初始頻率區(qū)間分為兩個子頻率區(qū)間;
根據(jù)所述子頻率區(qū)間,對所述第三多人聲語音進行語音分離,直至提取所有單人聲語音,以作為第三單人聲語音。
可選地,所述根據(jù)所述子頻率區(qū)間,對所述第三多人聲語音進行語音分離的步驟具體包括:
根據(jù)所述子頻率區(qū)間,對所述第三多人聲語音進行語音分離,得到分離中間結果;
判斷所述分離中間結果是否只包含單人聲語音;
若所述分離中間結果只包含單人聲語音,則將所述分離中間結果作為第三單人聲語音;
若所述分離中間結果為多人聲語音,則基于預設二分算法對所述子頻率區(qū)間拆分,形成新的子頻率區(qū)間,執(zhí)行所述根據(jù)所述子頻率區(qū)間,對所述第三多人聲語音進行語音分離,得到分離中間結果的步驟,直至所述分離中間結果只包含單人聲語音,將所述分離中間結果作為第三單人聲語音。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州國音智能科技有限公司,未經(jīng)廣州國音智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911099096.0/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結構
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





