[發明專利]語音處理方法、裝置、設備和存儲介質在審
| 申請號: | 202010768877.0 | 申請日: | 2020-08-03 |
| 公開(公告)號: | CN114067821A | 公開(公告)日: | 2022-02-18 |
| 發明(設計)人: | 熊飛飛;馮津偉 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L21/0264;G10L21/043;G10L25/60;G10L25/84;G10L25/87;G10L15/05;G10L19/24 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 趙娟 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 處理 方法 裝置 設備 存儲 介質 | ||
本申請實施例提供了一種語音處理方法、裝置、設備和存儲介質,所述方法包括:獲取待處理語音數據;對所述待處理語音數據中的音頻幀進行噪聲檢測;若確定所述音頻幀為噪聲幀,則對所述音頻幀進行噪聲消除并輸出;從而實現消除瞬時噪聲。
技術領域
本申請涉及計算機技術領域,特別是涉及一種語音處理方法和裝置、一種電子設備和一種存儲介質。
背景技術
視頻會議是指通過現有的通信媒體傳輸媒體,字符靜態,動態圖像,語音,文字,圖片等多個不同地點的個人或群體(連接到電視,計算機),使用戶的地理分散通過圖形,聲音等通信手段,決策討論。
目前視頻會議過程中,經常會遇到不連續的瞬時噪音;例如,辦公場景中,敲鍵盤的聲音、點擊鼠標的聲音、揉紙翻書的聲音、開關門的聲音、移動物件的聲音等。這些噪音并不是一直伴隨著會議全過程,但還是極大影響了聽覺體驗。
現有技術中,通常采用單通道消噪,即通過在頻域追蹤噪音,然后用譜減法來實現;其缺陷是只能追蹤并消除穩態噪音,對于瞬時噪音沒有消除效果。
發明內容
本申請實施例提供了一種語音處理方法,以消除瞬時噪音。
相應的,本申請實施例還提供了一種語音處理裝置、一種電子設備以及一種存儲介質,用以保證上述方法的實現及應用。
為了解決上述問題,本申請實施例公開了一種語音處理方法,所述方法包括:獲取待處理語音數據;對所述待處理語音數據中的音頻幀進行噪聲檢測;若確定所述音頻幀為噪聲幀,則對所述音頻幀進行噪聲消除并輸出。
可選地,所述對所述待處理語音數據中的音頻幀進行噪聲檢測,包括:采用語音檢測器和端點檢測算法,對所述待處理語音數據中的音頻幀進行噪聲檢測。
可選地,所述采用語音檢測器和端點檢測算法,對所述待處理語音數據中的音頻幀進行噪聲檢測,包括:將所述音頻幀輸入至所述語音檢測器中,得到所述語音檢測器輸出的第一檢測信息;以及采用端點檢測算法對所述音頻幀進行檢測,得到所述第二檢測信息;依據所述第一檢測信息和第二檢測信息,對所述待處理語音數據中的音頻幀進行噪聲檢測。
可選地,所述第一檢測信息包括音頻幀的語音檢測電平,所述第二檢測信息包括音頻幀為語音幀的概率;所述依據所述第一檢測信息和第二檢測信息,對所述待處理語音數據中的音頻幀進行噪聲檢測,包括:當所述音頻幀的語音檢測電平為高電平且所述音頻幀的上一音頻幀為語音幀時,若所述音頻幀和所述音頻幀的后N個音頻幀為語音幀的概率均小于第一預設閾值,則確定所述音頻幀為噪聲幀;當所述音頻幀的語音檢測電平為低電平且所述音頻幀的上一音頻幀為噪聲幀時,若所述音頻幀和所述音頻幀的后M個音頻幀為語音幀的概率均大于第二預設閾值,則確定所述音頻幀為語音幀;當所述音頻幀的語音檢測電平為高電平且所述音頻幀的上一音頻幀為噪聲幀時,若所述音頻幀為語音幀的概率小于第一預設閾值,則確定所述音頻幀為噪聲幀;當所述音頻幀的語音檢測電平為低電平且所述音頻幀的上一音頻幀為語音幀時,若所述音頻幀為語音幀的概率大于第二預設閾值,則確定所述音頻幀為語音幀。
可選地,所述對所述音頻幀進行噪聲消除,包括:通過降低所述音頻幀的音頻幅度或能量,對所述音頻幀進行噪聲消除。
可選地,所述的方法還包括:對所述待處理音頻數據進行底噪估計,確定所述待處理音頻數據的底噪特征信息;采用所述底噪特征信息對所述進行噪聲消除后的噪聲幀進行填充。
可選地,所述的方法還包括:若所述音頻幀為語音幀,判斷所述音頻幀和所述音頻幀最近的噪聲幀的時間差值;若所述時間差值小于第一設定時長,則對所述音頻幀進行加速;輸出加速后的所述音頻幀。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010768877.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電堆發電模塊
- 下一篇:圖像幀編碼方法、對象搜索方法、計算機設備、存儲介質





