[發明專利]一種數據分類方法、裝置、設備及存儲介質在審
| 申請號: | 202210193867.8 | 申請日: | 2022-03-01 |
| 公開(公告)號: | CN114610953A | 公開(公告)日: | 2022-06-10 |
| 發明(設計)人: | 傅司超;曹瓊;詹憶冰;陶大程 | 申請(專利權)人: | 京東科技信息技術有限公司 |
| 主分類號: | G06F16/901 | 分類號: | G06F16/901;G06F16/906;G06F16/903 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 倪焱 |
| 地址: | 100176 北京市大興區經濟*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 分類 方法 裝置 設備 存儲 介質 | ||
1.一種數據分類方法,其特征在于,包括:
將獲取到的待處理數據集輸入到第一目標分類模型中;其中,所述待處理數據集包括待處理支撐集和待處理查詢集,所述待處理支撐集包含多個有標簽數據,所述待處理查詢集包含多個無標簽數據,所述第一目標分類模型包括訓練完成的第一目標特征嵌入模型和第一目標圖結構模型;
通過所述第一目標特征嵌入模型,提取所述待處理支撐集和待處理查詢集分別對應的待處理支撐特征和待處理查詢特征,并將所述待處理支撐特征和所述待處理查詢特征輸出給所述第一目標圖結構模型;
通過所述第一目標圖結構模型,基于預設目標函數和所述待處理支撐特征,對基于所述待處理查詢特征確定的初始圖結構進行優化更新,得到更新結果,并基于所述更新結果,確定所述待處理查詢集中各待處理查詢數據分別對應的分類標簽。
2.根據權利要求1所述的方法,其特征在于,所述有標簽數據包含支撐圖片數據和與所述支撐圖片數據對應的分類標簽數據,所述無標簽數據包含查詢圖片數據,相應的,所述初始圖結構用于表征所述待處理查詢集中各查詢圖片數據之間的初始局部幾何信息。
3.根據權利要求2所述的方法,其特征在于,所述更新結果包括目標圖結構與所述目標圖結構對應的目標標簽概率分布矩陣,相應的,所述基于預設目標函數和所述待處理支撐特征,對基于所述待處理查詢特征確定的初始圖結構進行優化更新,得到更新結果,包括:
基于預設目標函數、所述待處理支撐特征以及基于待處理查詢特征確定的初始圖結構,確定初始標簽概率分布矩陣;
基于所述初始標簽概率分布矩陣和所述預設目標函數,確定目標圖結構,并基于所述目標圖結構和所述預設目標函數,確定目標標簽概率分布矩陣;
其中,所述目標圖結構用于表征待處理查詢集中各查詢圖片數據之間在特征空間和標簽空間中的目標局部幾何信息,所述目標標簽概率分布矩陣用于表征所述待處理查詢集中各查詢圖片數據分別與所述待處理支撐集對應的分類標簽數據之間的目標標簽概率,所述預設目標函數用于表征圖結構與標簽概率分布矩陣之間的函數關系。
4.根據權利要求3所述的方法,其特征在于,所述基于所述初始標簽概率分布矩陣和所述預設目標函數,確定目標圖結構,包括:
基于所述初始標簽概率分布矩陣和所述預設目標函數,確定所述待處理查詢集中各查詢圖片數據之間在標簽空間中的標簽概率距離;
基于所述待處理查詢特征和所述預設目標函數,確定所述待處理查詢集中各查詢圖片數據之間在特征空間中的特征距離;
基于所述標簽概率距離和所述特征距離,確定目標圖結構。
5.根據權利要求4所述的方法,其特征在于,所述基于所述標簽概率距離和所述特征距離,確定目標圖結構,包括:
基于所述標簽概率距離和所述特征距離,確定目標幾何距離;
針對所述待處理查詢集中的每個查詢圖片數據,基于預設分類算法,對所述查詢圖片數據與所述待處理查詢集中其他查詢圖片數據之間的目標幾何距離進行分類篩選;
基于篩選到的目標幾何距離,確定所述查詢圖片數據對應的目標子圖結構。
6.根據權利要求3所述的方法,其特征在于,所述方法還包括:
基于所述目標圖結構和所述目標標簽概率分布矩陣,判斷所述預設目標函數對應的函數損失值是否收斂;
如果是,則基于所述目標標簽概率分布矩陣,確定所述待處理查詢集中各查詢圖片數據分別對應的分類標簽;
如果否,則基于所述目標標簽概率分布矩陣和所述預設目標函數,確定優化后的目標標簽概率分布矩陣,并基于優化后的目標概率分布矩陣,重復執行判斷所述預設目標函數對應的函數損失值是否收斂的操作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于京東科技信息技術有限公司,未經京東科技信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210193867.8/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





