[發明專利]音頻處理方法、裝置、設備及存儲介質在審
| 申請號: | 202210173776.8 | 申請日: | 2022-02-24 |
| 公開(公告)號: | CN114554353A | 公開(公告)日: | 2022-05-27 |
| 發明(設計)人: | 周嶺松 | 申請(專利權)人: | 北京小米移動軟件有限公司;北京小米松果電子有限公司 |
| 主分類號: | H04R3/00 | 分類號: | H04R3/00;H04R1/10;H04R1/08;H04R1/02;G10L25/30;G10L21/0272;G10L21/0208;G10L21/02 |
| 代理公司: | 北京博思佳知識產權代理有限公司 11415 | 代理人: | 康瑩 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 處理 方法 裝置 設備 存儲 介質 | ||
本公開是關于一種音頻處理方法、裝置、設備及存儲介質,該方法應用于音頻處理設備,所述音頻處理設備包括揚聲器和前饋麥克風,所述方法包括:獲取環境音頻信號,根據預設的第一濾波器組對所述環境音頻信號進行濾波,得到第一音頻信號;將所述第一音頻信號輸入預設的神經網絡模型,得到第二音頻信號;將所述第一音頻信號和所述第二音頻信號發送給所述音頻處理設備的揚聲器;控制所述揚聲器同步播放所述第一音頻信號和所述第二音頻信號。本公開可以確保耳機的通透性,使耳機能夠提供更清晰的語音且不提升噪聲,進而可以提升用戶的體驗。
技術領域
本公開涉及信號處理技術領域,尤其涉及一種音頻處理方法、裝置、設備及存儲介質。
背景技術
日常生活中,當用戶戴著耳機要與他人對話時,往往無法聽清他人的講話。為了實現更清晰地對話,通常需要摘下耳機,這會給用戶帶來不便,影響用戶的體驗。
發明內容
為克服相關技術中存在的問題,本公開實施例提供一種音頻處理方法、裝置、設備及存儲介質,用以解決相關技術中的缺陷。
根據本公開實施例的第一方面,提供一種音頻處理方法,應用于音頻處理設備,所述音頻處理設備包括揚聲器和前饋麥克風;所述方法包括:
獲取環境音頻信號,其中,所述環境音頻信號為所述前饋麥克風所采集的所述音頻處理設備周圍環境中的聲音信號;
根據預設的第一濾波器組對所述環境音頻信號進行濾波,得到第一音頻信號;
將所述第一音頻信號輸入預設的神經網絡模型,得到第二音頻信號,其中,所述神經網絡模型通過機器學習的方式進行訓練得到,用于將第一音頻信中的人聲信號和噪音信號進行分離;所述噪音信號的頻段與所述人聲信號頻段重疊;
將所述第一音頻信號和所述第二音頻信號發送給所述揚聲器;
控制所述揚聲器同步播放所述第一音頻信號和所述第二音頻信號。
在一實施例中,所述將所述第一音頻信號輸入預設的神經網絡模型,得到第二音頻信號,包括:
將所述第一音頻信號劃分為多幀音頻信號;
將所述多幀音頻信號分別輸入至所述神經網絡模型進行語音增強,得到多幀增強音頻信號;
基于所述多幀增強音頻信號中前一幀信號的第一邊界對相連的后一幀信號的第二邊界進行優化,得到優化后的各幀信號。
在一實施例中,所述將所述多幀音頻信號分別輸入至所述神經網絡模型進行語音增強,包括:
基于所述神經網絡模型識別所述多幀音頻信號中的語音信號和噪聲信號;
對所述多幀音頻信號中的語音信號進行保留,并刪除所述噪聲信號。
在一實施例中,所述基于所述多幀增強音頻信號中前一幀信號的第一邊界對相連的后一幀信號的第二邊界進行優化,包括:
確定所述第二邊界的平滑程度等級;
基于所述平滑程度等級對應的優化策略,對所述第二邊界進行優化。
在一實施例中,所述確定所述第二邊界的平滑程度等級,包括:
響應于確定所述第一邊界的邊界信號值與所述第二邊界的邊界信號值相同,將所述平滑程度等級確定為預設第一等級。
在一實施例中,所述確定所述第二邊界的平滑程度等級,包括:
響應于確定所述第一邊界的邊界信號值與所述第二邊界的邊界信號值滿足以下任一項,將所述平滑程度等級確定為預設第二等級:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京小米移動軟件有限公司;北京小米松果電子有限公司,未經北京小米移動軟件有限公司;北京小米松果電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210173776.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于閥門金屬密封圈成型用的滾圓機
- 下一篇:一種鋼卷放卷裝置





