[發明專利]一種信息處理裝置有效
| 申請號: | 202011530775.1 | 申請日: | 2020-12-22 |
| 公開(公告)號: | CN112507154B | 公開(公告)日: | 2022-02-11 |
| 發明(設計)人: | 劉靖宇;韓旭;劉琦;趙宣棟 | 申請(專利權)人: | 哈爾濱師范大學 |
| 主分類號: | G06F16/55 | 分類號: | G06F16/55;G06K9/62;G06F16/583;G06F16/58;G06V10/764;G06V10/774 |
| 代理公司: | 哈爾濱市航友知識產權代理事務所(普通合伙) 23216 | 代理人: | 李紅爽;宋詩非 |
| 地址: | 150025 黑龍江*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 信息處理 裝置 | ||
本發明提供了一種信息處理裝置,該裝置包括訓練數據獲取單元、第一訓練單元、人臉標記單元、第二訓練單元、信息獲取單元、第一分類單元、第二分類單元、子集獲得單元、分組單元、第一計算單元、第二計算單元以及確定單元。信息處理裝置獲取包含人物照和非人物照的訓練數據集訓練第一分類模型將人物照再分為單人照、小合照或集體照來訓練第二分類模型;對待處理圖像集分類得到單人照、小合照、集體照和非人物照子集;基于拍攝信息和人臉標記結果對每個子集分組,以滿足第一、第二預定條件;針對每個組除保留圖像以外的每個圖像,若其與該組任一保留圖像相似度高于第一閾值,將且確定為待刪除圖像以供用戶處理。
技術領域
本發明涉及信息處理技術領域,具體涉及一種信息處理裝置。
背景技術
隨著智能設備的發展和普及,人們現在可以隨時隨地拍照、錄像。
然而,操作的方便也使得諸如手機等設備的存儲空間越來越小。在存儲空間中常存在大量的重復數據,例如重復照片。
目前,尚無針對這種可疑視頻的有效處理技術。
發明內容
在下文中給出了關于本發明的簡要概述,以便提供關于本發明的某些方面的基本理解。應當理解,這個概述并不是關于本發明的窮舉性概述。它并不意圖確定本發明的關鍵或重要部分,也不意圖限定本發明的范圍。其目的僅僅是以簡化的形式給出某些概念,以此作為稍后論述的更詳細描述的前序。
本發明提供了一種信息處理裝置,以解決現有技術的上述問題。
本發明提供了一種信息處理裝置,所述信息處理裝置包括:訓練數據獲取單元,用于獲取第一訓練數據集和第二訓練數據集;第一訓練單元,用于利用所述第一訓練數據集和所述第二訓練數據集訓練第一分類模型,其中,所述第一訓練數據集包括多個第一訓練圖像,每個第一訓練圖像的標簽為人物照標簽;所述第二訓練數據集包括多個第二訓練圖像,每個第二訓練圖像的標簽為非人物照標簽;人臉標記單元,用于對所述第一訓練數據集中的每個第一訓練圖像中的人臉進行標記;若該第一訓練圖像中標記的人臉個數為1,則將該第一訓練圖像的當前標簽更新為單人照標簽;若該第一訓練圖像中標記的人臉個數為2或3,則將該第一訓練圖像的當前標簽更新為小合照標簽;若該第一訓練圖像中標記的人臉個數大于或等于4,則將該第一訓練圖像的當前標簽更新為集體照標簽;第二訓練單元,用于利用所述第一訓練數據集及其中各第一訓練圖像的當前標簽訓練第二分類模型;信息獲取單元,用于獲得待處理圖像集以及所述待處理圖像集中每個圖像對應的拍攝信息,所述拍攝信息至少包括拍攝時間和拍攝地點;第一分類單元,用于通過所述第一分類模型對所述待處理圖像集進行分類,得到人物照和非人物照兩類;第二分類單元,用于通過所述第二分類模型對所述待處理圖像集中的所有人物照繼續分類,得到單人照、小合照以及集體照三類;子集獲得單元,用于基于所述第一分類模型和所述第二分類模型的分類結果,將所述待處理圖像集分為四個子集,該四個子集包括單人照子集、小合照子集、集體照子集和非人物照子集;分組單元,用于針對所述四個子集中的每一子集,基于拍攝信息和人臉標記結果對該子集進行分組,得到該子集對應的多個組,使得分組后的同一組中各圖像的拍攝信息滿足第一預定條件,且同一組中各圖像的人臉標記結果滿足第二預定條件;第一計算單元,用于針對所述單人照子集、小合照子集或集體照子集中每個子集的每個組,確定該組中每個圖像中的人臉區域,計算該組每個圖像的人臉區域中各個人臉清晰度,并將每個圖像對應的最低的人臉清晰度作為該圖像的人臉區域清晰度,在該組中基于人臉區域清晰度選擇至少一個保留圖像;第二計算單元,用于針對所述非人物照子集的每個組,在該組中基于圖像清晰度選擇至少一個保留圖像;確定單元,用于在每個子集的每個組中,針對該組中除保留圖像以外的每個圖像,若該圖像與該組任一保留圖像之間的相似度高于第一閾值,將該圖像確定為該組的待刪除圖像。
進一步地,所述分組單元用于:使得分組后的同一組中的各圖像之間的拍攝時間相差不超過預定時間,且拍攝地點相差不超過預定距離。
進一步地,所述拍攝信息還包括拍攝參數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱師范大學,未經哈爾濱師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011530775.1/2.html,轉載請聲明來源鉆瓜專利網。





