[發明專利]一種語音噪聲分析方法及系統在審
| 申請號: | 202011499230.9 | 申請日: | 2020-12-15 |
| 公開(公告)號: | CN114639390A | 公開(公告)日: | 2022-06-17 |
| 發明(設計)人: | 劉剛;龔科 | 申請(專利權)人: | 暗物智能科技(廣州)有限公司 |
| 主分類號: | G10L25/03 | 分類號: | G10L25/03;G10L25/30;G10L25/51 |
| 代理公司: | 北京三聚陽光知識產權代理有限公司 11250 | 代理人: | 胡曉靜;李紅團 |
| 地址: | 511400 廣東省廣州市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 噪聲 分析 方法 系統 | ||
本發明提供了一種語音噪聲分析方法及系統,該方法包括:獲取待分析語音數據;從待分析語音數據中提取出僅包含噪聲的噪聲音頻片段;基于每個噪聲音頻片段的噪聲強度指標和預設噪聲強度劃分等級,確定各噪聲音頻片段對應的噪聲強度等級;根據各噪聲音頻片段對應的噪聲強度等級的分布情況,確定所述待分析語音數據的噪聲水平評估結果。通過計算僅包含噪聲的噪聲音頻片段的噪聲強度指標來進行單獨分析,然后根據所有噪聲音頻片段的噪聲強度等級的分布情況確定整個待分析語音數據的噪聲水平評估結果,避免了正常語音的影響,實現了對待分析語音數據噪聲水平的客觀評估,并且無需參考音頻,應用范圍更廣,能夠準確的反映各種場景下的噪聲情況。
技術領域
本發明涉及語音信號處理技術領域,具體涉及一種語音噪聲分析方法及系統。
背景技術
隨著移動互聯網的高速發展,通訊軟件的應用也越來越廣泛,例如:越來越多的老師通過即時通訊軟件對學生進行在線教學輔導,以替代傳統的面對面教學方式。但是,在使用通訊軟件時,噪聲會嚴重影響通訊音頻質量,在對噪聲有較高要求的場所,例如:學生通過通訊軟件在線收聽老師錄制的音頻課程時,對音頻課程內的音頻噪聲盡可能小,以提高授課效果。然而,由于在線教學音頻數量巨大,傳統依靠人工去分析每節課堂的噪聲的方式,工作量龐大且分析結果具有極大主觀性。
而現有技術中,客觀評估噪聲情況的指標評價方式(如信噪比、分段信噪比等)在在衡量一條音頻的噪聲情況時需要有與之嚴格時間對齊的語音內容完全相同的參考音頻,而對于教學場景或者其他無法獲得參考音頻的情況下,現有噪聲評估方法將無法進行噪聲評估,因此,如何實現在沒有參考音頻的情況下對語音噪聲的客觀評估是一個亟待解決的問題。
發明內容
有鑒于此,本發明實施例提供了一種語音噪聲分析方法及系統,以克服現有技術中對在沒有參考音頻的情況下,難以實現語音噪聲客觀評估的問題。
本發明實施例提供了一種語音噪聲分析方法,包括:
獲取待分析語音數據;
從所述待分析語音數據中提取出僅包含噪聲的噪聲音頻片段;
基于每個噪聲音頻片段的噪聲強度指標和預設噪聲強度劃分等級,確定各所述噪聲音頻片段對應的噪聲強度等級;
根據各所述噪聲音頻片段對應的噪聲強度等級的分布情況,確定所述待分析語音數據的噪聲水平評估結果。
可選地,所述從所述待分析語音數據中提取出僅包含噪聲的噪聲音頻片段,包括:
基于所述待分析語音數據的總時長及預設提取時長周期,將所述待分析語音數據劃分為多個音頻片段;
將每個音頻片段轉換為幅度譜;
將每個音頻片段對應的幅度譜輸入預設噪聲分類模型,得到每個音頻片段對應的僅包含噪聲的概率;
基于預設概率閾值從音頻片段中篩選僅包含噪聲的噪聲音頻片段。
可選地,所述基于每個噪聲音頻片段的噪聲強度指標和預設噪聲強度劃分等級,確定各所述噪聲音頻片段對應的噪聲強度等級,包括:
分別計算每個噪聲音頻片段對應的噪聲強度指標;
獲取所述預設噪聲強度劃分等級中不同噪聲強度等級對應的噪聲強度指標范圍;
根據當前噪聲音頻片段對應的噪聲強度指標,確定所述當前噪聲音頻片段對應的當前噪聲強度指標范圍;
將所述當前噪聲強度指標范圍對應的噪聲強度等級確定為所述當前噪聲音頻片段的噪聲強度等級。
可選地,所述根據各所述噪聲音頻片段對應的噪聲強度等級的分布情況,確定所述待分析語音數據的噪聲水平,包括:
獲取各所述噪聲音頻片段中不同噪聲強度等級的占比;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于暗物智能科技(廣州)有限公司,未經暗物智能科技(廣州)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011499230.9/2.html,轉載請聲明來源鉆瓜專利網。





