[發明專利]一種數據處理方法及裝置有效
| 申請號: | 202110025996.1 | 申請日: | 2021-01-08 |
| 公開(公告)號: | CN112613492B | 公開(公告)日: | 2022-02-11 |
| 發明(設計)人: | 石曄瓊 | 申請(專利權)人: | 哈爾濱師范大學 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V40/10;G06V10/774;G06V10/764;G06K9/62 |
| 代理公司: | 哈爾濱市航友知識產權代理事務所(普通合伙) 23216 | 代理人: | 李紅爽;宋詩非 |
| 地址: | 150025 黑龍江*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據處理 方法 裝置 | ||
本發明提供了一種數據處理方法及裝置。數據處理方法包括:獲取第一訓練數據集,通過摳除第一訓練圖像中人物區域得到的背景圖像作為第二訓練圖像;訓練第一分類模型,使其識別人物照和非人物照;對人物照訓練數據分集,訓練第二分類模型,使其識別單人照、小合照和集體照;基于拍攝信息和人臉標記結果對每個子集內分組,使同一組各圖像拍攝信息滿足第一預定條件,且同一組各圖像的人臉標記結果滿足第二預定條件;根據人臉清晰度,在單人照子集、小合照子集或集體照子集中選取保留圖像,以基于背景相似度選取待刪除圖像供用戶確定;根據圖像清晰度在非人物照子集中選取保留圖像,以基于圖像相似度選取待刪除圖像供用戶確定。
技術領域
本發明涉及圖像處理技術領域,具體涉及一種數據處理方法及裝置。
背景技術
現在,智能設備在人們的日常生活中隨處可見,人們利用智能設備能夠隨時隨時通訊、運動以及拍照等。智能設備具有一定的存儲空間,除此之外,能夠通過4G或5G網絡訪問互聯網,將設備上的數據部分或全部存儲或上傳至互聯網存儲媒介。
然而,無論是設備本地的存儲空間,亦或是網絡存儲空間,空間都是有限的,當存儲空間所剩無幾時需要刪除一些用處不大的數據,例如重復數據等。
發明內容
在下文中給出了關于本發明的簡要概述,以便提供關于本發明的某些方面的基本理解。應當理解,這個概述并不是關于本發明的窮舉性概述。它并不意圖確定本發明的關鍵或重要部分,也不意圖限定本發明的范圍。其目的僅僅是以簡化的形式給出某些概念,以此作為稍后論述的更詳細描述的前序。
本發明提供了一種數據處理方法及裝置,以解決現有技術的上述問題。
本發明提供了一種數據處理方法,所述數據處理方法包括:獲取第一訓練數據集;所述第一訓練數據集包括多個包含人物的第一訓練圖像,每個第一訓練圖像的標簽為人物照標簽;針對所述第一訓練數據集中的每個第一訓練圖像,將該第一訓練圖像包含的人物區域摳除,獲得該第一訓練圖像的背景圖像,將該背景圖像作為該第一訓練圖像對應的第二訓練圖像;利用獲得的所有第二訓練圖像構成第二訓練數據集;利用所述第一訓練數據集和所述第二訓練數據集訓練第一分類模型,其中,所述第二訓練數據集包括多個第二訓練圖像,每個第二訓練圖像的標簽為非人物照標簽;對所述第一訓練數據集中的每個第一訓練圖像中的人臉進行標記;若該第一訓練圖像中標記的人臉個數為1,則將該第一訓練圖像的當前標簽更新為單人照標簽;若該第一訓練圖像中標記的人臉個數為2或3,則將該第一訓練圖像的當前標簽更新為小合照標簽;若該第一訓練圖像中標記的人臉個數大于或等于4,則將該第一訓練圖像的當前標簽更新為集體照標簽;利用所述第一訓練數據集及其中各第一訓練圖像的當前標簽訓練第二分類模型;獲得待處理圖像集以及所述待處理圖像集中每個圖像對應的拍攝信息,所述拍攝信息至少包括拍攝時間和拍攝地點;通過所述第一分類模型對所述待處理圖像集進行分類,得到人物照和非人物照兩類;通過所述第二分類模型對所述待處理圖像集中的所有人物照繼續分類,得到單人照、小合照以及集體照三類;基于所述第一分類模型和所述第二分類模型的分類結果,將所述待處理圖像集分為四個子集,該四個子集包括單人照子集、小合照子集、集體照子集和非人物照子集;針對所述四個子集中的每一子集,基于拍攝信息和人臉標記結果對該子集進行分組,得到該子集對應的多個組,使得分組后的同一組中各圖像的拍攝信息滿足第一預定條件,且同一組中各圖像的人臉標記結果滿足第二預定條件;針對所述單人照子集、小合照子集或集體照子集中每個子集的每個組,確定該組中每個圖像中的人臉區域,計算該組每個圖像的人臉區域中各個人臉清晰度,并將每個圖像對應的最低的人臉清晰度作為該圖像的人臉區域清晰度,在該組中基于人臉區域清晰度選擇至少一個保留圖像;在所述單人照子集、小合照子集或集體照子集中每個子集的每個組中,針對該組中除保留圖像以外的每個圖像,若該圖像對應的背景圖像與該組任一保留圖像對應的背景圖像之間的相似度高于第一閾值,將該圖像確定為該組的待刪除圖像;針對所述非人物照子集的每個組,在該組中基于圖像清晰度選擇至少一個保留圖像;在所述非人物照子集的每個組中,針對該組中除保留圖像以外的每個圖像,若該圖像與該組任一保留圖像之間的相似度高于第一閾值,將該圖像確定為該組的待刪除圖像;將每個子集的每個組的待刪除圖像以縮略圖形式展示給用戶,以根據用戶選擇來確定是否刪除對應的待刪除圖像。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱師范大學,未經哈爾濱師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110025996.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種可全景測量的中粒料休止角測定儀
- 下一篇:基于區塊鏈的數據處理方法和裝置





