[發明專利]模型訓練方法、分類信息生成方法、裝置、設備和介質在審
| 申請號: | 202310560745.2 | 申請日: | 2023-05-17 |
| 公開(公告)號: | CN116644346A | 公開(公告)日: | 2023-08-25 |
| 發明(設計)人: | 潘瀅煒;姚霆;梅濤 | 申請(專利權)人: | 京東科技控股股份有限公司 |
| 主分類號: | G06F18/241 | 分類號: | G06F18/241;G06F18/214;G06N3/0464;G06F17/16 |
| 代理公司: | 北京唯智勤實知識產權代理事務所(普通合伙) 11557 | 代理人: | 姜悅 |
| 地址: | 102600 北京市大興區北京經*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 方法 分類 信息 生成 裝置 設備 介質 | ||
本公開的實施例公開了模型訓練方法、分類信息生成方法、裝置、設備和介質。該方法的一具體實施方式包括:響應于確定模型訓練未達到預定訓練階段,生成初始域獨占特征信息;生成初始正交損失信息;對初始域獨占特征識別模型、獨占特征權重矩陣和域不變特征權重矩陣進行參數初步更新;響應于確定模型訓練達到預定訓練階段,生成初步域獨占特征信息,以及生成初始域不變特征信息;根據初步域獨占特征信息、初始域不變特征信息、更新后獨占特征權重矩陣和更新后域不變特征權重矩陣,對初步更新后的分類模型進行模型訓練。該實施方式與人工智能有關,利用訓練得到的分類模型,可以準確地實現針對各種模態形式的數據的數據分類。
技術領域
本公開的實施例涉及計算機技術領域,具體涉及模型訓練方法、分類信息生成方法、裝置、設備和介質。
背景技術
目前,深度學習神經網絡在各種計算機視覺任務上都取得了突破性的進展。對于分類模型的訓練,通常采用的方式為:首先,基于不同的數據增強算法,生成不同分布的偽訓練數據集。然后,結合現有域泛化技術,實現分類模型的模型訓練。
然而,發明人發現,當采用上述方式來訓練模型,經常會存在如下技術問題:
由于僅能針對圖像模態的數據進行數據增強處理,導致分類模型僅能對圖像模態的數據進行分類。使得針對其他模態的數據,不能準確地進行分類。
該背景技術部分中所公開的以上信息僅用于增強對本發明構思的背景的理解,并因此,其可包含并不形成本國的本領域普通技術人員已知的現有技術的信息。
發明內容
本公開的內容部分用于以簡要的形式介紹構思,這些構思將在后面的具體實施方式部分被詳細描述。本公開的內容部分并不旨在標識要求保護的技術方案的關鍵特征或必要特征,也不旨在用于限制所要求的保護的技術方案的范圍。
本公開的一些實施例提出了模型訓練方法、分類信息生成方法、裝置、設備和介質,來解決以上背景技術部分提到的技術問題。
第一方面,本公開的一些實施例提供了一種模型訓練方法,包括:響應于確定初始分類模型的模型訓練未達到預定訓練階段,利用初始域獨占特征識別模型,生成針對第一數據的初始域獨占特征信息,其中,上述初始分類模型包括:上述初始域獨占特征識別模型和初始域不變特征識別模型;生成針對獨占特征權重矩陣和域不變特征權重矩陣的初始正交損失信息;根據上述初始正交損失信息和針對上述初始域獨占特征信息的域獨占特征損失信息,對上述初始域獨占特征識別模型、上述獨占特征權重矩陣和上述域不變特征權重矩陣進行參數初步更新;響應于確定初步更新后的分類模型的模型訓練達到上述預定訓練階段,利用初步更新后的域獨占特征識別模型,生成針對第二數據的初步域獨占特征信息,以及利用上述初始域不變特征識別模型,生成針對上述第二數據的初始域不變特征信息;根據上述初步域獨占特征信息、上述初始域不變特征信息、更新后獨占特征權重矩陣和更新后域不變特征權重矩陣,對上述初步更新后的分類模型進行模型訓練。
可選地,上述初始域獨占特征識別模型包括:初始特征提取模型和初始多頭偏見分類模型;以及上述利用初始域獨占特征識別模型,生成針對第一數據的初始域獨占特征信息,包括:將上述第一數據輸入至上述初始特征提取模型,以輸出第一數據特征信息;將上述第一數據特征信息輸入至上述初始多頭偏見分類模型,以輸出上述初始域獨占特征信息。
可選地,上述根據上述初始正交損失信息和針對上述初始域獨占特征信息的域獨占特征損失信息,對上述初始域獨占特征識別模型、上述獨占特征權重矩陣和上述域不變特征權重矩陣進行參數初步更新,包括:根據上述初始正交損失信息和上述域獨占特征損失信息,生成模型訓練損失信息;根據上述模型訓練損失信息,對上述初始特征提取模型、上述初始多頭偏見分類模型、上述獨占特征權重矩陣和上述域不變特征權重矩陣進行參數初步更新,得到更新后特征提取模型、更新后多頭偏見分類模型、上述更新后獨占特征權重矩陣和上述更新后域不變特征權重矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于京東科技控股股份有限公司,未經京東科技控股股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310560745.2/2.html,轉載請聲明來源鉆瓜專利網。





