[發明專利]目標對象分類方法、系統、電子設備及存儲介質在審
| 申請號: | 202210532331.4 | 申請日: | 2022-05-11 |
| 公開(公告)號: | CN114913871A | 公開(公告)日: | 2022-08-16 |
| 發明(設計)人: | 張楠;王健宗;瞿曉陽 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G10L25/24 | 分類號: | G10L25/24;G10L25/30;G10L25/45;G10L17/04 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 葉恩華 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標 對象 分類 方法 系統 電子設備 存儲 介質 | ||
1.一種目標對象分類方法,其特征在于,所述方法包括:
獲取目標對象的原始語音信號;
將所述原始語音信號輸入至預設的目標對象分類模型中;其中,所述目標對象分類模型包括時域特征提取器和Transformer模型,所述時域特征提取器和所述Transformer模型構成端到端結構;
基于所述時域特征提取器對所述原始語音信號進行特征提取處理,得到梅爾濾波器組特征信號;
對所述梅爾濾波器組特征信號進行譜增強以及下采樣處理,得到預處理語音信號,基于所述Transformer模型對所述預處理語音信號進行特征提取處理,得到所述目標對象的分類結果。
2.根據權利要求1所述的目標對象分類方法,其特征在于,所述時域特征提取器通過以下步驟構建:
獲取預加重模塊、分幀模塊、加窗模塊、短時傅里葉變換模塊和梅爾濾波模塊;
將所述預加重模塊、所述分幀模塊、所述加窗模塊和所述短時傅里葉變換模塊依次組合成卷積層,并將所述梅爾濾波模塊組合成全連接層;
根據所述卷積層和所述全連接層得到所述時域特征提取器。
3.根據權利要求1或2所述的目標對象分類方法,其特征在于,所述時域特征提取器通過以下步驟訓練:
獲取多個原始樣本的樣本語音信號;
將所述樣本語音信號輸入至所述時域特征提取器中得到樣本梅爾濾波器組特征信號,根據所述樣本梅爾濾波器組特征信號得到時域特征損失值,并根據所述時域特征損失值優化更新所述時域特征提取器的參數。
4.根據權利要求1所述的目標對象分類方法,其特征在于,所述Transformer模型包括多個Transformer組,所述Transformer模型通過以下步驟訓練:
獲取訓練樣本,所述訓練樣本包括多個預處理音頻數據;
將所述預處理音頻數據輸入至所述Transformer模型,得到各個所述Transformer組輸出的幀級特征;其中,所述幀級特征包括句子特征和多個語音幀對應的語音特征;
根據所述句子特征和各個所述語音特征之間的距離確定Transformer模型損失值,根據所述Transformer模型損失值優化更新所述Transformer模型的參數。
5.根據權利要求4所述的目標對象分類方法,其特征在于,所述語音特征為所述幀級特征的第一幀,所述語音特征為所述幀級特征除所述第一幀外的其余幀,所述根據所述句子特征和各個所述語音特征之間的距離確定Transformer模型損失值,包括:
構建所述Transformer模型的分類損失函數;
構建所述Transformer模型的擴散損失函數,所述擴散損失函數表征所述第一幀與各個所述其余幀之間的距離之和;
根據所述分類損失函數和所述擴散損失函數的差值得到所述Transformer模型訓練時所用的所述模型損失函數,并根據所述模型損失函數得到所述Transformer模型損失值。
6.根據權利要求5所述的目標對象分類方法,其特征在于,所述構建所述Transformer模型的分類損失函數,包括:
獲取縮放因子、超參數以及自然常數;
以所述自然常數為底,并根據所述縮放因子、所述幀級特征的相位角和所述超參數得到的指數作為第一參數;
以所述自然常數為底,并根據所述縮放因子和所述幀級特征的相位角得到的指數作為第二參數;
根據所述第一參數和所述第二參數計算附加角裕度損失函數,并將得到的所述附加角裕度損失函數作為所述分類損失函數。
7.根據權利要求5所述的目標對象分類方法,其特征在于,所述構建所述Transformer模型的擴散損失函數,包括:
獲取所述第一幀與各個所述其余幀之間的KL散度;
將得到的所述Transformer模型內的多個所述KL散度求和得到所述擴散損失函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210532331.4/1.html,轉載請聲明來源鉆瓜專利網。





