[發明專利]語音增強處理方法、語音增強處理裝置及存儲介質在審
| 申請號: | 202310067432.3 | 申請日: | 2023-01-13 |
| 公開(公告)號: | CN116193319A | 公開(公告)日: | 2023-05-30 |
| 發明(設計)人: | 鐘雙蓮;史潤宇;劉念 | 申請(專利權)人: | 北京小米移動軟件有限公司 |
| 主分類號: | H04R1/32 | 分類號: | H04R1/32 |
| 代理公司: | 北京鉦霖知識產權代理有限公司 11722 | 代理人: | 李志新;楊繼成 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 增強 處理 方法 裝置 存儲 介質 | ||
1.一種語音增強處理方法,其特征在于,應用于可穿戴語音設備,所述方法包括:
響應于檢測到語音輸入,采集當前語音信號,并獲取所述可穿戴語音設備中姿態傳感器輸出的當前傳感參數;
基于所述當前傳感參數,確定所述可穿戴語音設備在當前佩戴姿態下對應的當前波束圖方向;
基于所述當前波束圖方向和所述當前語音信號進行音源聚焦,以對所述當前語音信號進行增強。
2.根據權利要求1所述的方法,其特征在于,所述基于所述當前傳感參數,確定所述可穿戴語音設備在當前佩戴姿態下對應的當前波束圖方向,包括:
獲取預先存儲的基準傳感參數以及基準波束圖方向;
基于所述當前傳感參數、所述基準傳感參數以及基準波束圖方向,確定所述可穿戴語音設備在當前佩戴姿態下對應的當前波束圖方向。
3.根據權利要求2所述的方法,其特征在于,所述基于所述當前傳感參數、所述基準傳感參數以及基準波束圖方向,確定所述可穿戴語音設備在當前佩戴姿態下對應的當前波束圖方向,包括:
基于所述當前傳感參數,確定所述可穿戴語音設備的當前姿態矩陣,并基于所述基準傳感參數,確定基準姿態矩陣;
基于所述當前姿態矩陣和所述基準姿態矩陣,確定所述可穿戴語音設備當前波束角度相對基準角度之間的角度變化量;
基于所述基準傳感參數與基準波束圖方向具有對應關系;
將所述角度變化量與基準波束圖方向進行角度映射,得到所述可穿戴語音設備在當前佩戴姿態下對應的當前波束圖方向。
4.根據權利要求2或3所述的方法,其特征在于,所述基準傳感參數以及基準波束圖方向基于所述可穿戴語音設備首次被穿戴時采集的聲音信號確定。
5.根據權利要求4所述的方法,其特征在于,所述基準傳感參數以及基準波束圖方向采用如下方式基于所述可穿戴語音設備首次被穿戴時采集的聲音信號確定:
響應于確定所述可穿戴語音設備首次被穿戴,發出第一提示信息,所述提示信息用于提示用戶發出語音;
采集用戶發出的語音信號,使用多個不同波束圖方向,對采集到的語音信號進行音源聚焦,以對采集到的語音信號進行增強;
響應于完成對采集到的語音信號進行增強,發出第二提示信息,所述第二提示信息用于提示用戶選擇語音質量最高的增強后語音;
將與用戶選擇的增強后語音對應的波束圖方向作為基準波束圖方向,并獲取所述可穿戴語音設備首次被穿戴時所述姿態傳感器輸出的傳感參數,作為基準傳感參數。
6.一種語音增強處理裝置,其特征在于,應用于可穿戴語音設備,所述裝置包括:
采集單元,用于響應于檢測到語音輸入,采集當前語音信號,并獲取所述可穿戴語音設備中姿態傳感器輸出的當前傳感參數;
計算單元,用于基于所述當前傳感參數,確定所述可穿戴語音設備在當前佩戴姿態下對應的當前波束圖方向;
波束形成單元,用于基于所述當前波束圖方向和所述當前語音信號進行音源聚焦,以對所述當前語音信號進行增強。
7.根據權利要求6所述的裝置,其特征在于,所述計算單元采用如下方式基于所述當前傳感參數,確定所述可穿戴語音設備在當前佩戴姿態下對應的當前波束圖方向:
獲取預先存儲的基準傳感參數以及基準波束圖方向;
基于所述當前傳感參數、所述基準傳感參數以及基準波束圖方向,確定所述可穿戴語音設備在當前佩戴姿態下對應的當前波束圖方向。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京小米移動軟件有限公司,未經北京小米移動軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310067432.3/1.html,轉載請聲明來源鉆瓜專利網。





