[發明專利]一種數據處理方法、裝置、設備及存儲介質在審
| 申請號: | 202210529898.6 | 申請日: | 2022-05-16 |
| 公開(公告)號: | CN115019119A | 公開(公告)日: | 2022-09-06 |
| 發明(設計)人: | 張俊麗;王奇剛;李遠輝;舒紅喬 | 申請(專利權)人: | 聯想(北京)有限公司 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V10/764;G06F16/35;G06F16/906;G06N3/08 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 馬麗;王黎延 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據處理 方法 裝置 設備 存儲 介質 | ||
本申請公開了一種數據處理方法、裝置、設備及存儲介質,包括:在散點圖上確定第一散點;所述散點圖包括第一類型的散點和第二類型的散點,一個所述第一類型的散點表征一個原始標簽數據;一個第二類型的散點表征一個無標簽數據;所述第一散點為任一個所述第一類型的散點;所述第一散點表征第一數據;基于所述散點圖,確定所述第一散點的鄰域半徑范圍;在所述鄰域半徑范圍內,確定所述第一散點的擴展區域;將所述擴展區域內的所述第二類型的散點的標簽配置為所述第一散點的第一標簽。對于本申請的方案,消耗的時間和存儲空間??;且標注的準確度高。
技術領域
本申請涉及數據處理技術領域,涉及但不限于數據處理方法、裝置、設備及存儲介質。
背景技術
隨著數據處理技術的不斷發展,自動化標注技術也得到廣泛發展。
相關技術中,對于具有少量可信任標簽的圖像分類數據集,可以通過標簽傳播方法將已有標簽傳播到其它未標注數據,以實現對數據集的自動化標注。相關技術中的標簽傳播算法,需要基于所有數據構建關系圖,并計算各數據間的概率轉移矩陣,并基于概率轉移矩陣對所有數據集進行標注。
在相關技術中,一方面,由于計算概率轉移矩陣的時間和存儲空間消耗較大,所以耗時長,需要的存儲空間也大;另一方面,基于概率轉移矩陣的標簽傳播算法,對于每一個數據都會得到一個標簽,所以無法保證標注的準確率。
如何保證傳播范圍的準確,如何實現標簽傳播的高效、簡捷、易用是待解決的問題。
發明內容
本申請提供一種數據處理方法及裝置、設備、存儲介質。
本申請的技術方案是這樣實現的:
本申請提供了一種數據處理方法,所述方法包括:在散點圖上確定第一散點;所述散點圖包括第一類型的散點和第二類型的散點,一個所述第一類型的散點表征一個原始標簽數據;一個第二類型的散點表征一個無標簽數據;所述第一散點為任一個所述第一類型的散點;所述第一散點表征第一數據;
基于所述散點圖,確定所述第一散點的鄰域半徑范圍;所述鄰域半徑范圍用于表征所述第一散點可傳播的鄰域半徑的取值范圍;
在所述鄰域半徑范圍內,確定所述第一散點的擴展區域;
將所述擴展區域內的所述第二類型的散點的標簽配置為所述第一散點的第一標簽;所述第一標簽用于表征所述第一數據所屬的數據類型。
本申請提供了一種數據處理裝置,所述裝置包括:
第一確定單元,用于在散點圖上確定第一散點;所述散點圖包括第一類型的散點和第二類型的散點,一個所述第一類型的散點表征一個原始標簽數據;一個第二類型的散點表征一個無標簽數據;所述第一散點為任一個所述第一類型的散點;所述第一散點表征第一數據;
第二確定單元,用于基于所述散點圖,確定所述第一散點的鄰域半徑范圍;所述鄰域半徑范圍用于表征所述第一散點可傳播的鄰域半徑的取值范圍;
第三確定單元,用于在所述鄰域半徑范圍內,確定所述第一散點的擴展區域;
處理單元,用于將所述擴展區域內的所述第二類型的散點的標簽配置為所述第一散點的第一標簽;所述第一標簽用于表征所述第一數據所屬的數據類型。
本申請還提供了一種電子設備,包括:存儲器和處理器,所述存儲器存儲有可在處理器上運行的計算機程序,所述處理器執行所述程序時實現上述數據處理方法。
本申請還提供了一種存儲介質,其上存儲有計算機程序,該計算機程序被處理器執行時實現上述數據處理方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于聯想(北京)有限公司,未經聯想(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210529898.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于張量多屬性特征遷移的分類方法
- 下一篇:一種高安全性的電梯用開關電源





