[發明專利]語音處理方法及裝置有效
| 申請號: | 201810251444.0 | 申請日: | 2018-03-26 |
| 公開(公告)號: | CN108510987B | 公開(公告)日: | 2020-10-23 |
| 發明(設計)人: | 王昭;周嶺松 | 申請(專利權)人: | 北京小米移動軟件有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L21/0216;G10L21/0232;G10L25/51 |
| 代理公司: | 北京博思佳知識產權代理有限公司 11415 | 代理人: | 林祥 |
| 地址: | 100085 北京市海淀區清河*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 處理 方法 裝置 | ||
1.一種語音處理方法,其特征在于,所述方法用于基于分布式麥克風陣列的決策設備上,所述分布式麥克風陣列包括多個子陣列,包括:
獲取每個所述子陣列中各個麥克風接收到的喚醒語音信號;
確定每個所述子陣列中各個所述喚醒語音信號對應的頻域變換信號、以及每兩個所述頻域變換信號之間的第一互相關函數;
根據每個所述子陣列中的各個所述第一互相關函數,確定所述喚醒語音信號對應的喚醒子陣列,包括:計算每個所述子陣列中的各個所述第一互相關函數的平均值,所述平均值用于表征對應的子陣列接收信號的大小,將最大所述平均值所對應的子陣列確定為所述喚醒子陣列;
其中,所述計算每個所述子陣列中的各個所述第一互相關函數的平均值,包括采用相位變換加權PHAT方式、以及預設的頻譜權重函數,對每個所述子陣列中的各個所述第一互相關函數進行加權,得到加權后的第三互相關函數,然后計算每個所述子陣列中的各個所述第三互相關函數的平均值,所述預設的頻譜權重函數中的權重值與所述子陣列中各個麥克風的信噪比相對應。
2.根據權利要求1所述的方法,其特征在于,所述計算每個所述子陣列中的各個所述第一互相關函數的平均值,包括:
采用相位變換加權PHAT方式對每個所述子陣列中的各個所述第一互相關函數進行加權,得到加權后的第二互相關函數;
計算每個所述子陣列中的各個所述第二互相關函數的平均值。
3.根據權利要求1所述的方法,其特征在于,所述計算每個所述子陣列中的各個所述第三互相關函數的平均值,包括:
設置一個球面網格,所述球面網格包括多個離散點;
在各個所述離散點處確定每個所述子陣列中的各個所述第三互相關函數的值;
根據每個所述子陣列中的各個所述第三互相關函數的值,計算每個所述子陣列中的各個所述第三互相關函數的值的平均值。
4.一種語音處理裝置,其特征在于,所述裝置用于基于分布式麥克風陣列的決策設備上,所述分布式麥克風陣列包括多個子陣列,包括:
獲取模塊,被配置為獲取每個所述子陣列中各個麥克風接收到的喚醒語音信號;
第一確定模塊,被配置為確定每個所述子陣列中各個所述喚醒語音信號對應的頻域變換信號、以及每兩個所述頻域變換信號之間的第一互相關函數;
第二確定模塊,被配置為根據每個所述子陣列中的各個所述第一互相關函數,確定所述喚醒語音信號對應的喚醒子陣列;所述第二確定模塊包括:
第一計算子模塊,被配置為計算每個所述子陣列中的各個所述第一互相關函數的平均值,所述平均值用于表征對應的子陣列接收信號的大小;第一確定子模塊,被配置為將最大所述平均值所對應的子陣列確定為所述喚醒子陣列;
其中,所述第一計算子模塊包括:第二加權子模塊,被配置為采用相位變換加權PHAT方式、以及預設的頻譜權重函數,對每個所述子陣列中的各個所述第一互相關函數進行加權,得到加權后的第三互相關函數;第三計算子模塊,被配置為計算每個所述子陣列中的各個所述第三互相關函數的平均值;所述預設的頻譜權重函數中的權重值與所述子陣列中各個麥克風的信噪比相對應。
5.根據權利要求4所述的裝置,其特征在于,所述第一計算子模塊包括:
第一加權子模塊,被配置為采用相位變換加權PHAT方式對每個所述子陣列中的各個所述第一互相關函數進行加權,得到加權后的第二互相關函數;
第二計算子模塊,被配置為計算每個所述子陣列中的各個所述第二互相關函數的平均值。
6.根據權利要求4所述的裝置,其特征在于,所述第三計算子模塊,包括:
設置子模塊,被配置為設置一個球面網格,所述球面網格包括多個離散點;
第二確定子模塊,被配置為在各個所述離散點處確定每個所述子陣列中的各個所述第三互相關函數的值;
第四計算子模塊,被配置為根據每個所述子陣列中的各個所述第三互相關函數的值,計算每個所述子陣列中的各個所述第三互相關函數的值的平均值。
7.一種語音處理裝置,其特征在于,所述裝置用于基于分布式麥克風陣列的決策設備上,所述分布式麥克風陣列包括多個子陣列,包括:
處理器;
用于存儲處理器可執行指令的存儲器;
其中,所述處理器被配置為:
獲取每個所述子陣列中各個麥克風接收到的喚醒語音信號;
確定每個所述子陣列中各個所述喚醒語音信號對應的頻域變換信號、以及每兩個所述頻域變換信號之間的第一互相關函數;
根據每個所述子陣列中的各個所述第一互相關函數,確定所述喚醒語音信號對應的喚醒子陣列,包括:計算每個所述子陣列中的各個所述第一互相關函數的平均值,所述平均值用于表征對應的子陣列接收信號的大小,將最大所述平均值所對應的子陣列確定為所述喚醒子陣列;
其中,所述計算每個所述子陣列中的各個所述第一互相關函數的平均值,包括采用相位變換加權PHAT方式、以及預設的頻譜權重函數,對每個所述子陣列中的各個所述第一互相關函數進行加權,得到加權后的第三互相關函數,然后計算每個所述子陣列中的各個所述第三互相關函數的平均值,所述預設的頻譜權重函數中的權重值與所述子陣列中各個麥克風的信噪比相對應。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京小米移動軟件有限公司,未經北京小米移動軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810251444.0/1.html,轉載請聲明來源鉆瓜專利網。





