[發明專利]語音增強優化方法及語音增強優化系統、可讀存儲介質在審
| 申請號: | 202011581295.8 | 申請日: | 2020-12-28 |
| 公開(公告)號: | CN112652324A | 公開(公告)日: | 2021-04-13 |
| 發明(設計)人: | 蕭博耀 | 申請(專利權)人: | 深圳萬興軟件有限公司 |
| 主分類號: | G10L21/0232 | 分類號: | G10L21/0232;G10L21/0272 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 黃廣龍 |
| 地址: | 518000 廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 增強 優化 方法 系統 可讀 存儲 介質 | ||
本申請公開了一種語音增強優化方法及語音增強優化系統、可讀存儲介質。本申請的語音增強優化方法,包括:獲取音頻數據信息;對所述音頻數據信息進行音頻分離處理,以得到背景噪音段數據;對所述背景噪音段數據進行頻譜特性估計處理,得到噪音頻譜;根據所述噪音頻譜對所述音頻數據信息進行降噪處理,得到目標音頻。本申請所提供的語音增強優化方法通過對音頻數據信息進行音頻分離處理,并對得到的背景噪音段數據進行頻譜特征估計,以得到用于表征噪音分布特征的噪音頻譜。
技術領域
本申請涉及語音處理技術領域,尤其涉及一種語音增強優化方法及語音增強優化系統、計算機可讀存儲介質。
背景技術
在相關技術中,由于錄音環境、錄音設備的影響導致語音錄音中背景噪音,而背景噪音的存在容易影響使用者對語音錄音的整體感知、理解程度。
例如,通過手動降噪的方式對語音錄音中沒有語音的背景噪音部份進行框選,并通過對背景噪音部份進行噪音特性估計以對語音錄音進行手動降噪。然而,一般的噪音特性估計方式需要通過使用者手動對背景噪音提取,以對語音錄音進行降噪處理。
發明內容
本申請旨在至少解決現有技術中存在的技術問題之一。為此,本申請提出一種語音增強優化方法及語音增強優化系統、可讀存儲介質,本申請所提供的語音增強優化方法通過對音頻數據信息進行音頻分離處理,并對得到的背景噪音段數據進行頻譜特征估計,以得到用于表征噪音分布特征的噪音頻譜。
本申請實施例第一方面提供一種語音增強優化方法,包括:
獲取音頻數據信息;
對所述音頻數據信息進行音頻分離處理,以得到背景噪音段數據;
對所述背景噪音段數據進行頻譜特性估計處理,得到噪音頻譜;
根據所述噪音頻譜對所述音頻數據信息進行降噪處理,得到目標音頻。
本申請實施例中語音增強優化方法包括如下技術效果:通過對音頻數據信息進行音頻分離處理,并對得到的背景噪音段數據進行頻譜特征估計,以得到用于表征噪音分布特征的噪音頻譜。根據噪音頻譜對整個音頻數據信息進行降噪處理,以使得目標音頻更加接近于純凈的無噪音錄音,從而簡化背景噪音段數據的提取步驟。
在一些實施例中,所述對所述音頻數據信息進行音頻分離處理,以得到所述背景噪音段數據,包括:
對所述音頻數據信息進行初步檢測處理,生成語音檢測原始標簽;
對所述語音檢測原始標簽進行保持時間處理,生成語音檢測處理標簽;
對所述語音檢測處理標簽進行偵測確保處理,生成語音檢測擴展標簽;
對所述語音檢測擴展標簽進行反向偵測處理,生成背景音標簽;
根據所述背景音標簽對所述音頻數據信息進行音頻分離處理得到所述背景噪音段數據。在一些實施例中,所述對所述音頻數據信息進行初步檢測處理,生成語音檢測原始標簽,還包括:
對所述音頻數據信息進行分幀處理、加窗處理,得到音頻子數據信息;對所述音頻子數據信息進行對數倒頻譜處理,得到音頻對數倒頻譜;根據預設閾值、所述音頻對數倒頻譜,生成所述語音檢測原始標簽。
在一些實施例中,所述對所述音頻子數據信息進行對數倒頻譜處理,得到音頻對數倒頻譜,還包括:
對所述音頻子數據信息進行傅里葉變換處理、平方處理,并得到第一變換數據;對所述第一變換數據進行對數處理、逆傅里葉變換處理,并得到第二變換數據;對所述第二變換數據進行平方處理、倒數處理得到所述音頻對數倒頻譜。
在一些實施例中,所述對所述語音檢測原始標簽進行保持時間處理,生成語音檢測處理標簽,還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳萬興軟件有限公司,未經深圳萬興軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011581295.8/2.html,轉載請聲明來源鉆瓜專利網。





