[發明專利]一種數據分類方法、裝置、設備及存儲介質在審
| 申請號: | 202210193867.8 | 申請日: | 2022-03-01 |
| 公開(公告)號: | CN114610953A | 公開(公告)日: | 2022-06-10 |
| 發明(設計)人: | 傅司超;曹瓊;詹憶冰;陶大程 | 申請(專利權)人: | 京東科技信息技術有限公司 |
| 主分類號: | G06F16/901 | 分類號: | G06F16/901;G06F16/906;G06F16/903 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 倪焱 |
| 地址: | 100176 北京市大興區經濟*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 分類 方法 裝置 設備 存儲 介質 | ||
本發明公開了一種數據分類方法、裝置、設備及存儲介質,包括:將獲取到的待處理數據集輸入到第一目標分類模型中;其中,待處理數據集包括待處理支撐集和待處理查詢集;通過第一目標分類模型中的第一目標特征嵌入模型,提取待處理支撐集和待處理查詢集分別對應的待處理支撐特征和待處理查詢特征,并將待處理支撐特征和待處理查詢特征進行輸出;通過第一目標分類模型中的第一目標圖結構模型,基于預設目標函數和待處理支撐數據,對基于待處理查詢特征確定的初始圖結構進行優化更新,得到更新結果,并基于更新結果,確定待處理查詢集中各待處理查詢數據分別對應的分類標簽。本發明解決了圖結構的構建方法固定的問題,提高了分類模型的識別性能。
技術領域
本發明涉及人工智能技術領域,尤其涉及一種數據分類方法、裝置、設備及存儲介質。
背景技術
隨著互聯網技術和移動智能終端的飛速發展,依賴于大規模標記數據訓練的深度學習方法在各個領域中都取得了巨大的成功。然而,在實際的生活應用中,許多問題只能提供極其有限的標記數據,其無法滿足深度學習在大規模標記數據上訓練的需求。
小樣本學習方法被提出來去解決上述問題,作為小樣本學習方法中的一種典型方法,基于轉導理論的小樣本方法充分利用小樣本學習任務中的少量有標記數據和大量無標記數據之間的圖結構信息來預測無標記數據的類別信息,該方法高度依賴于在特征空間上構建的圖結構,即采用傳統的距離度量方法,構建訓練樣本在特征空間上靜態的圖結構。
在實現本發明的過程中,發現現有技術中至少存在以下技術問題:
現有的圖結構的構建方法簡單且固定,導致小樣本模型的識別性能較差。
發明內容
本發明提供了一種數據分類方法、裝置、設備及存儲介質,以解決現有的圖結構的構建方法簡單且固定的問題,提高分類模型在小樣本數據任務中的識別性能。
根據本發明的一方面,提供了一種數據分類方法,該方法包括:
將獲取到的待處理數據集輸入到第一目標分類模型中;其中,所述待處理數據集包括待處理支撐集和待處理查詢集,所述待處理支撐集包含多個有標簽數據,所述待處理查詢集包含多個無標簽數據,所述第一目標分類模型包括訓練完成的第一目標特征嵌入模型和第一目標圖結構模型;
通過所述第一目標特征嵌入模型,提取所述待處理支撐集和待處理查詢集分別對應的待處理支撐特征和待處理查詢特征,并將所述待處理支撐特征和所述待處理查詢特征輸出給所述第一目標圖結構模型;
通過所述第一目標圖結構模型,基于預設目標函數和所述待處理支撐特征,對基于所述待處理查詢特征確定的初始圖結構進行優化更新,得到更新結果,并基于所述更新結果,確定所述待處理查詢集中各待處理查詢數據分別對應的分類標簽。
根據本發明的另一方面,提供了一種數據分類裝置,該裝置包括:
待處理數據集輸入模塊,用于將獲取到的待處理數據集輸入到第一目標分類模型中;其中,所述待處理數據集包括待處理支撐集和待處理查詢集,所述待處理支撐集包含多個有標簽數據,所述待處理查詢集包含多個無標簽數據,所述第一目標分類模型包括訓練完成的第一目標特征嵌入模型和第一目標圖結構模型;
特征提取模塊,用于通過所述第一目標特征嵌入模型,提取所述待處理支撐集和待處理查詢集分別對應的待處理支撐特征和待處理查詢特征,并將所述待處理支撐特征和所述待處理查詢特征輸出給所述第一目標圖結構模型;
分類標簽確定模塊,用于通過所述第一目標圖結構模型,基于預設目標函數和所述待處理支撐特征,對基于所述待處理查詢特征確定的初始圖結構進行優化更新,得到更新結果,并基于所述更新結果,確定所述待處理查詢集中各待處理查詢數據分別對應的分類標簽。
根據本發明的另一方面,提供了一種電子設備,所述電子設備包括:
至少一個處理器;以及
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于京東科技信息技術有限公司,未經京東科技信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210193867.8/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





