[發明專利]目標對象分類方法、系統、電子設備及存儲介質在審
| 申請號: | 202210532331.4 | 申請日: | 2022-05-11 |
| 公開(公告)號: | CN114913871A | 公開(公告)日: | 2022-08-16 |
| 發明(設計)人: | 張楠;王健宗;瞿曉陽 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G10L25/24 | 分類號: | G10L25/24;G10L25/30;G10L25/45;G10L17/04 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 葉恩華 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標 對象 分類 方法 系統 電子設備 存儲 介質 | ||
本發明提供了一種目標對象分類方法、系統、電子設備及存儲介質,屬于人工智能技術領域,目標對象分類方法包括:獲取目標對象的原始語音信號;將原始語音信號輸入至預設的目標對象分類模型中;其中,目標對象分類模型包括時域特征提取器和Transformer模型,時域特征提取器和Transformer模型構成端到端結構;基于時域特征提取器對原始語音信號進行特征提取處理,得到梅爾濾波器組特征信號;對梅爾濾波器組特征信號進行譜增強以及下采樣處理,得到預處理語音信號,基于Transformer模型對預處理語音信號進行特征提取處理,得到目標對象的分類結果,本發明實現了從原始語音輸入中提取說話人判別特征,提高了說話人特征的容量和識別能力,能夠有效對目標對象進行分類。
技術領域
本發明涉及人工智能技術領域,尤其涉及一種目標對象分類方法、系統、電子設備及存儲介質。
背景技術
說話人驗證(Speaker Verification,SV)是一個二元分類任務,目的是驗證一個未知的話語是否屬于其聲稱的身份,在SV的研究中,通常用深度神經網絡來提取作為目標對象的說話人的特征,注意力機制(Attention)是一種強有力的獲得更有鑒別性的話語級特征的方法。相關技術中的SV模型以及方法不能從原始語音輸入中提取說話人判別特征,限制了說話人特征的容量和識別能力,無法有效對目標對象進行分類。
發明內容
本發明實施例的主要目的在于提出一種目標對象分類方法、系統、電子設備及存儲介質,實現了從原始語音輸入中提取說話人判別特征,提高了說話人特征的容量和識別能力,能夠有效對目標對象進行分類。
為實現上述目的,本發明實施例的第一方面提出了一種目標對象分類方法,所述方法包括:
獲取目標對象的原始語音信號;
將所述原始語音信號輸入至預設的目標對象分類模型中;其中,所述目標對象分類模型包括時域特征提取器和Transformer模型,所述時域特征提取器和所述Transformer模型構成端到端結構;
基于所述時域特征提取器對所述原始語音信號進行特征提取處理,得到梅爾濾波器組特征信號;
對所述梅爾濾波器組特征信號進行譜增強以及下采樣處理,得到預處理語音信號,基于所述Transformer模型對所述預處理語音信號進行特征提取處理,得到所述目標對象的分類結果。
在本發明的一些實施例中,所述時域特征提取器通過以下步驟構建:
獲取預加重模塊、分幀模塊、加窗模塊、短時傅里葉變換模塊和梅爾濾波模塊;
將所述預加重模塊、所述分幀模塊、所述加窗模塊和所述短時傅里葉變換模塊依次組合成卷積層,并將所述梅爾濾波模塊組合成全連接層;
根據所述卷積層和所述全連接層得到所述時域特征提取器。
在本發明的一些實施例中,所述時域特征提取器通過以下步驟訓練:
獲取多個原始樣本的樣本語音信號;
將所述樣本語音信號輸入至所述時域特征提取器中得到樣本梅爾濾波器組特征信號,根據所述樣本梅爾濾波器組特征信號得到時域特征損失值,并根據所述時域特征損失值優化更新所述時域特征提取器的參數。
在本發明的一些實施例中,所述Transformer模型包括多個Transformer組,所述Transformer模型通過以下步驟訓練:
獲取訓練樣本,所述訓練樣本包括多個預處理音頻數據;
將所述預處理音頻數據輸入至所述Transformer模型,得到各個所述Transformer組輸出的幀級特征;其中,所述幀級特征包括句子特征和多個語音幀對應的語音特征;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210532331.4/2.html,轉載請聲明來源鉆瓜專利網。





