[發明專利]一種數據處理方法和裝置、電子設備、存儲介質在審
| 申請號: | 202010100012.7 | 申請日: | 2020-02-18 |
| 公開(公告)號: | CN113342236A | 公開(公告)日: | 2021-09-03 |
| 發明(設計)人: | 余雪兵;康勇 | 申請(專利權)人: | 北京四維圖新科技股份有限公司 |
| 主分類號: | G06F3/0484 | 分類號: | G06F3/0484;G06T11/60 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 馬姣琴;臧建明 |
| 地址: | 100094 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據處理 方法 裝置 電子設備 存儲 介質 | ||
本公開提供一種數據處理方法和裝置、電子設備、存儲介質。包括:響應于接收到對第一數據集進行標注的請求,獲取預存的第二數據集,第二數據集包括已標注的至少一個圖片,根據第一數據集從至少一個圖片中選取目標圖片,從第一數據集中選取待標注圖片,確定待標注圖片的標注區域,根據標注區域對目標圖片進行粘貼,對粘貼后的圖片進行融合處理,生成標注圖片,對標注圖片進行顯示,通過從已經標注的圖片中選取目標圖片,以便將目標圖片粘貼至待標注圖片的標注區域,并對粘貼后的圖片進行融合處理,得到標注圖片,實現了節約人力和提高標注效率的技術效果,且實現了提高標注的準確性和可靠性的技術效果,且實現了標注的全面性和有效性的技術效果。
技術領域
本公開涉及互聯網技術領域,尤其涉及一種數據處理方法和裝置、電子設備、存儲介質。
背景技術
隨著計算機和互聯網技術的快速發展和普及,互聯網上存在海量的數據,這些數據主要以圖片等作為信息載體,對這些信息載體進行標注已成為計算機數據訓練的重要基礎。
在現有的技術方案中,在對圖片進行標注時,主要通過以下幾種方式實現:a、通過人工的方式將各類別的對象的邊緣用多邊形描繪出來;b、通過半人工的方式進行標注,如將部分標注的數據樣本訓練得到模型,通過模型對待標注圖片進行預測,得到預測結果,通過人工修正的方式對預測結果不正確的待標注圖片進行修正;c、通過處理深度圖數據,通過聚類和人工的方法對待標注圖片進行標注;d、通過風格遷移的方法將目標場景的風格遷移至已有的標注圖片上。
然而發明人在實現本公開的過程中,發現至少存在如下問題:采用方式a標注一張圖片的時間大約為2個小時,且需要人工參與,因此存在即耗時費力的問題;采用方式b標注一張圖片時間大約為1個小時,盡管相較于方式a已有改善,但依然存在耗費時間還是較長,且需要人工參與,耗費人力的問題;采用方式c時,深度圖的獲取需要依賴高精度的設備,在獲取過程中,很難避免因設備本身造成的誤差,且通過聚類和人工結合的方式盡管會節約一定的時間,還存在因算法本身造成的標注錯誤或標注不完全的問題;采用方式d,由于獲取的圖片與真實圖片差很多,很可能造成訓練的反面的影響。
發明內容
本公開提供一種數據處理方法和裝置、電子設備、存儲介質,用以解決上述技術問題中的至少一種。
一方面,本公開實施例提供一種數據處理方法,所述方法包括:
響應于接收到對第一數據集進行標注的請求,獲取預存的第二數據集,其中,所述第二數據集包括已標注的至少一個圖片;
根據所述第一數據集從所述至少一個圖片中選取目標圖片;
從所述第一數據集中選取待標注圖片,并確定所述待標注圖片的標注區域;
根據所述標注區域對所述目標圖片進行粘貼;
對粘貼后的圖片進行融合處理,生成標注圖片,以便對所述標注圖片進行顯示。
在一些實施例中,在所述獲取預存的第二數據集之前,所述方法還包括:
獲取預存的第三數據集,其中,所述第三數據集中包括已標注的各初始圖片,且每個所述初始圖片均包括至少一個類別的對象;
對每個所述初始圖片中的各個類別對應的對象分別進行裁剪處理,得到裁剪后的各圖片;
根據所述裁剪后的各圖片構建所述第二數據集。
在一些實施例中,所述對每個所述初始圖片中的各個類別對應的對象分別進行裁剪處理包括:
針對每個所述初始圖片中的任一類別對應的對象,將所述任一類別對應的對象的像素值設置為第一像素值,并將其他類別對應的對象的像素值設置為第二像素值;
確定所述第一像素值或所述第二像素值對應的聯通區域;
對所述聯通區域中的對象進行裁剪處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京四維圖新科技股份有限公司,未經北京四維圖新科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010100012.7/2.html,轉載請聲明來源鉆瓜專利網。





