[發(fā)明專利]一種噪聲提取方法、裝置、設備和存儲介質在審
| 申請?zhí)枺?/td> | 202011131906.9 | 申請日: | 2020-10-21 |
| 公開(公告)號: | CN112420022A | 公開(公告)日: | 2021-02-26 |
| 發(fā)明(設計)人: | 葉帥帥;胡新輝;徐欣康 | 申請(專利權)人: | 浙江同花順智能科技有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/04;G10L25/03 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 310023 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 噪聲 提取 方法 裝置 設備 存儲 介質 | ||
本發(fā)明公開了一種噪聲提取方法、裝置、設備和存儲介質。所述方法包括:獲取語音數(shù)據(jù)中各語音幀的聲學特征;將所述聲學特征輸入第一語音識別模型,獲得各語音幀的第一類別標簽;將所述聲學特征輸入第二語音識別模型,獲得各語音幀的音素標簽;根據(jù)所述音素標簽確定各語音幀的第二類別標簽;將所述第一類別標簽和所述第二類別標簽進行融合,獲得各語音幀的目標標簽;根據(jù)所述目標標簽確定噪聲段,并提取所述噪聲段。該方法通過將兩個神經(jīng)網(wǎng)絡的識別結果進行融合獲取語音數(shù)據(jù)中的噪聲,可以提高噪聲提取的準確性。
技術領域
本發(fā)明實施例涉及語音技術領域,尤其涉及一種噪聲提取方法、裝置、設備和存儲介質。
背景技術
語音技術作為人工智能(Artificial Intelligence,AI)的一個重要分支,在人機交互中扮演非常重要的角色。為了提升語音識別、聲紋識別等語音技術在實際語音應用系統(tǒng)中的抗噪性能以及魯棒性,使用噪聲語料對訓練語料進行增強是一種最重要、最常用的技術手段。
語音技術在實際使用過程中,大部分使用的都是開源的噪聲數(shù)據(jù)集,和實際使用場景噪聲匹配度不高,導致語音識別、聲紋識別等語音技術的效果不盡人意。為了進一步提升語音技術在實際場景中的性能,關鍵是需要利用實際應用場景下的環(huán)境噪聲數(shù)據(jù)進行數(shù)據(jù)增強,提升訓練數(shù)據(jù)和測試環(huán)境的匹配程度。
現(xiàn)有技術中是通過基于傳統(tǒng)的語音活動檢測(Voice Activity Detection,VAD)的結果進行噪聲提取,但是這種方法在檢測低能量的語音和高能量的噪聲的時候往往會誤判,導致提取出來的噪聲還會包含有語音片段。
因此,如何對實際環(huán)境語音中的噪聲進行有效提取是當前亟待解決的技術問題。
發(fā)明內容
本發(fā)明實施例提供了一種噪聲提取方法、裝置、設備和存儲介質,利用該方法,能夠更加準確的提取實際環(huán)境語音中的噪聲段。
第一方面,本發(fā)明實施例提供了一種噪聲提取方法,包括:
獲取語音數(shù)據(jù)中各語音幀的聲學特征;
將所述聲學特征輸入第一語音識別模型,獲得各語音幀的第一類別標簽;
將所述聲學特征輸入第二語音識別模型,獲得各語音幀的音素標簽;
根據(jù)所述音素標簽確定各語音幀的第二類別標簽;
將所述第一類別標簽和所述第二類別標簽進行融合,獲得各語音幀的目標標簽;
根據(jù)所述目標標簽確定噪聲段,并提取所述噪聲段。
第二方面,本發(fā)明實施例還提供了一種噪聲提取裝置,包括:
聲學特征獲取模塊,用于獲取語音數(shù)據(jù)中各語音幀的聲學特征;
第一類別標簽獲取模塊,用于將所述聲學特征輸入第一語音識別模型,獲得各語音幀的第一類別標簽;
音素標簽獲取模塊,用于將所述聲學特征輸入第二語音識別模型,獲得各語音幀的音素標簽;
第二類別標簽確定模塊,用于根據(jù)所述音素標簽確定各語音幀的第二類別標簽;
標簽融合模塊,用于將所述第一類別標簽和所述第二類別標簽進行融合,獲得各語音幀的目標標簽;
噪聲段提取模塊,用于根據(jù)所述目標標簽確定噪聲段,并提取所述噪聲段。
第三方面,本發(fā)明實施例還提供了一種計算機設備,包括:
一個或多個處理器;
存儲裝置,用于存儲一個或多個程序;
當所述一個或多個程序被所述一個或多個處理器執(zhí)行,使得所述一個或多個處理器實現(xiàn)本發(fā)明任意實施例中所述的噪聲提取方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江同花順智能科技有限公司,未經(jīng)浙江同花順智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011131906.9/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





