[發(fā)明專利]語音處理方法、裝置、電子設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202210768487.2 | 申請日: | 2022-06-30 |
| 公開(公告)號: | CN115294997A | 公開(公告)日: | 2022-11-04 |
| 發(fā)明(設(shè)計)人: | 趙昊然;李楠;韓潤強;陳聯(lián)武;鄭羲光;張晨 | 申請(專利權(quán))人: | 北京達佳互聯(lián)信息技術(shù)有限公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208 |
| 代理公司: | 廣州三環(huán)專利商標代理有限公司 44202 | 代理人: | 賈允 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 處理 方法 裝置 電子設(shè)備 存儲 介質(zhì) | ||
1.一種語音處理方法,其特征在于,包括:
確定源語音信號的信號頻譜;
將所述源語音信號的信號頻譜分別輸入到多個回聲消除模型進行回聲消除處理,得到多個已處理信號頻譜;所述多個回聲消除模型的回聲消除性能不同;
將所述多個已處理信號頻譜,以及所述源語音信號的信號頻譜輸入到信號融合模型進行信號融合,得到與所述多個已處理信號頻譜各自對應的權(quán)重信息;所述多個已處理信號頻譜各自對應的權(quán)重信息與所述多個回聲消除模型的回聲消除性能相匹配;
基于所述多個已處理信號頻譜以及所述多個已處理信號頻譜各自對應的權(quán)重信息進行加權(quán)求和,得到目標語音信號的信號頻譜。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述信號融合模型包括局部特征提取層和時序特征提取層;
所述將所述多個已處理信號頻譜,以及所述源語音信號的信號頻譜輸入到信號融合模型進行信號融合,得到與所述多個已處理信號頻譜各自對應的權(quán)重信息,包括:
基于所述局部特征提取層對所述多個已處理信號頻譜,以及所述源語音信號的信號頻譜進行局部特征提取,得到與所述多個已處理信號頻譜,以及所述源語音信號的信號頻譜對應的局部頻譜特征信息;
基于所述時序特征提取層對所述局部頻譜特征信息進行時序特征提取,得到與所述多個已處理信號頻譜,以及所述源語音信號的信號頻譜對應的時序特征信息;
基于所述時序特征信息確定與所述多個已處理信號頻譜各自對應的權(quán)重信息。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述信號頻譜表征信號在每個時頻點的信號能量信息;所述每個時頻點基于時間維度以及頻率維度確定;
所述基于所述局部特征提取層對所述多個已處理信號頻譜,以及所述源語音信號的信號頻譜進行局部特征提取,得到與所述多個已處理信號頻譜,以及所述源語音信號的信號頻譜對應的局部頻譜特征信息之前,所述方法還包括:
基于所述多個已處理信號頻譜、所述源語音信號的信號頻譜、與所述多個已處理信號頻譜對應的輸入通道信息,以及與所述源語音信號的信號頻譜對應的輸入通道信息,構(gòu)建三維語音信號輸入矩陣;所述三維語音信號輸入矩陣的維度包括時間維度、頻率維度以及通道維度。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述局部特征提取層包括多個卷積層;
所述基于所述局部特征提取層對所述多個已處理信號頻譜,以及所述源語音信號的信號頻譜進行局部特征提取,得到與所述多個已處理信號頻譜,以及所述源語音信號的信號頻譜對應的局部頻譜特征信息,包括:
基于第一卷積層對應的第一卷積核,對所述三維語音信號輸入矩陣進行局部特征提取,得到第一局部特征信息;
基于第二卷積層對應的第二卷積核,對所述第一局部特征信息進行局部特征提取,得到第二局部特征信息;
基于所述第二局部特征信息確定所述局部頻譜特征信息;
所述第一卷積核、所述第二卷積核均為三維卷積核,所述三維卷積核的維度均與所述時間維度、所述頻率維度以及所述通道維度相對應;所述第二卷積層的數(shù)量為至少一個,所述第二卷積核的通道維度大于所述第一卷積核的通道維度。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述基于所述時序特征信息確定與所述多個已處理信號頻譜各自對應的權(quán)重信息,包括:
基于所述時序特征信息確定所述多個已處理信號頻譜在每個時頻點的權(quán)重值;所述多個已處理信號在相同時頻點的權(quán)重值之和為1;
基于所述多個已處理信號頻譜在每個時頻點的權(quán)重值,確定所述多個已處理信號頻譜各自對應的權(quán)重信息。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述信號融合模型包括信息平滑層;
所述基于所述多個已處理信號頻譜在每個時頻點的權(quán)重值,確定所述多個已處理信號頻譜各自對應的權(quán)重信息,包括:
基于所述信息平滑層對所述多個已處理信號頻譜在每個時頻點的權(quán)重值進行平滑處理,得到與所述多個已處理信號頻譜對應的平滑權(quán)重信息;
基于所述多個已處理信號頻譜對應的平滑權(quán)重信息,確定所述多個已處理信號頻譜各自對應的權(quán)重信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京達佳互聯(lián)信息技術(shù)有限公司,未經(jīng)北京達佳互聯(lián)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210768487.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:門鎖和箱體設(shè)備
- 下一篇:無線充電控制方法及無線充電設(shè)備





