[發明專利]語音處理方法及其裝置有效
| 申請號: | 201710910848.1 | 申請日: | 2017-09-29 |
| 公開(公告)號: | CN107749305B | 公開(公告)日: | 2021-08-24 |
| 發明(設計)人: | 吳俊楠;宋輝;崔瑋瑋 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L19/008;G10L25/78 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 處理 方法 及其 裝置 | ||
1.一種語音處理方法,其特征在于,包括以下步驟:
采集N路的當前語音幀;
對每一路的所述當前語音幀進行子帶分解,獲取所述當前語音幀的M個子帶信號;其中,N,M為正整數;
從各路的所述M個子帶信號中提取頻帶相同的子帶信號;
針對每個頻帶,對所述頻帶下的N路子帶信號進行波束形成,得到一路的第一語音信號,所述對所述頻帶下的N路子帶信號進行波束形成之前,對每路子帶信號進行降采樣;
對每個頻帶下的所述第一語音信號進行子帶合成,獲取所述當前語音幀的輸出信號,所述對每個頻帶下的所述第一語音信號進行子帶合成之前,對每個頻帶下的所述第一語音信號進行升采樣。
2.根據權利要求1所述的方法,其特征在于,所述對每一路的所述當前語音幀進行子帶分解,獲取所述當前語音幀的M個子帶信號,包括:
將所述當前語音幀輸入到由M個子帶濾波器組成的子帶濾波器組中;
利用每個子帶濾波器對所述當前語音幀進行濾波處理,形成所述子帶濾波器對應的子帶信號,由所有的所述子帶濾波器對應的所述子帶信號,構成所述當前語音幀的所述M個子帶信號;其中,所述子帶濾波器組中任意兩個子帶濾波器之間的頻帶不同。
3.根據權利要求1所述的方法,其特征在于,所述對每一路的所述當前語音幀進行子帶分解,獲取所述當前語音幀的M個子帶信號,包括:
利用長度為L的滑動窗對所述當前語音幀進行加窗,得到加窗信號;其中,所述L為M的整數倍;
對所述加窗信號進行切分獲取K個信號塊;其中,每個信號塊中包括M個頻帶;
根據所述K個信號塊獲取所述當前語音幀的M個子帶信號。
4.根據權利要求3所述的方法,其特征在于,所述根據K個信號塊獲取所述當前語音幀的M個子帶信號,包括:
將所述K個信號塊相加,得到第一信號塊,對所述第一信號塊進行傅里葉變換,得到所述當前語音幀的M個子帶信號。
5.根據權利要求3所述的方法,其特征在于,所述根據K個信號塊獲取所述當前語音幀的M個子帶信號,包括:
將所述K個信號塊中的每個信號塊進行傅里葉變換,得到所述信號塊的M個子帶信號;
將所有信號塊的M個子帶信號進行子帶合成,得到所述當前語音幀的M個子帶信號。
6.根據權利要求3所述的方法,其特征在于,所述根據K個信號塊獲取所述當前語音幀的M個子帶信號之后,還包括:
將所述滑動窗按照預設的抽取因子移動,對下一個語音幀進行加窗。
7.根據權利要求3所述的方法,其特征在于,所述滑動窗采用漢明窗。
8.根據權利要求1-7任一項所述的方法,其特征在于,所述針對每個頻帶,對所述頻帶下的N路子帶信號進行波束形成,得到一路的第一語音信號,包括:
利用最小方差無失真響應波束形成MVDR算法,對所述頻帶下N路子帶信號進行波束形成,得到一路的所述第一語音信號。
9.根據權利要求8所述的方法,其特征在于,所述利用最小方差無失真響應波束形成MVDR算法,對所述頻帶下N路子帶信號進行波束形成,得到一路的所述第一語音信號,包括:
基于最小方差自適應調整所述頻帶下的每一路子帶信號的權重;
獲取每一路子帶信號的延時信息,并對所述子帶信號進行延時處理;
將延時處理的每一路子帶信號進行疊加,形成所述第一語音信號。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710910848.1/1.html,轉載請聲明來源鉆瓜專利網。





