[發明專利]一種基于最大生成樹的人臉識別數據庫構成方法有效
| 申請號: | 201810441046.5 | 申請日: | 2018-05-10 |
| 公開(公告)號: | CN108614894B | 公開(公告)日: | 2021-07-02 |
| 發明(設計)人: | 龔勛;劉瑞楠;馬浩;師恩;章哲敏 | 申請(專利權)人: | 西南交通大學 |
| 主分類號: | G06F16/51 | 分類號: | G06F16/51;G06K9/00 |
| 代理公司: | 成都點睛專利代理事務所(普通合伙) 51232 | 代理人: | 孫一峰 |
| 地址: | 610031 四*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 最大 生成 識別 數據庫 構成 方法 | ||
本發明屬于人臉識別數據庫技術領域,具體的說是涉及一種基于最大生成樹的人臉識別數據庫構成方法。本發明總的技術方案為先根據圖片的標簽進行分組,再根據每組圖片的偏轉角度以及平均相似度選取基準圖片,采用最大生成樹的方式對每組圖片進行組內清理,剔除標簽錯誤的圖片。根據基準圖片進行組間合并,最后選取閾值進行組內去重。本發明的有益效果為,明整體操作簡單,采用自動化的方式實現圖片清理,能提升清理效果,消除數據冗余,且能保證多個海量人臉數據庫的有效融合,減少工作量。
技術領域
本發明屬于人臉識別數據庫技術領域,具體的說是涉及一種基于最大生成樹的人臉識別數據庫構成方法。
背景技術
生物識別技術針對的是某個個體,并且不同個體的生物特征在固定時期內也是相對穩定的,關鍵是這種技術不需要隨身攜帶,更不用設置復雜的密碼。因此采用生物識別技術進行身份鑒定既安全同時也十分方便,所以它被廣泛的應用于各種需要身份鑒定的領域,比如人臉識別、身份證、駕駛執照、護照等可以證明個人身份的證件。很多場合使用生物識別技術完成安全檢查,如海關、公安、銀行、保密機關等
人臉識別技術的應用。我們的日常生活中最常見的識別手段就是根據不同人的面部特征差異來區分不同的個體。由于人臉包含了大量豐富的生物特征,因此人臉識別已經在當今社會的個體身份識別當中占有舉足輕重的位置
伴隨著大數據和深度學習的發展,神經網絡深受矚目,并且在圖像分類、語音識別等應用中獲得了遠超經典方法的結果。因此研究者們致力于不斷改進網絡結構,同時擴大訓練樣本規模。人臉識別的一個基本的趨勢是:訓練數據規模越來越大,識別精度越來越高。
現有的數據集構建融合系統,通常需要大量的人工干預。不僅效率低,而且范圍小,人工不能挑選出太多的樣本,也有肉眼無法分辨的噪音圖片。
發明內容
本發明所要解決的,就是針對上述問題,提出一種基于最大生成樹的面向身份識別的海量人臉數據庫的自動構成方法。
本發明采用的技術方案是:
基于最大生成樹的人臉識別數據庫構成方法,其特征在于,包括以下步驟:
S1、搭建分布式服務器,即采用多個服務器同時處理多個人臉數據庫;
S2、每個服務器分別對獲取的每組人臉圖片進行預處理、提取特征、計算相似度和選取基準人臉;圖片的預處理包括:人臉檢測,人臉對齊,圖片歸一化,偏轉角度α計算,用現有的人臉識別模型提取圖片特征Feature,計算相似度S;
S3、根據步驟S2的預處理結果,對人臉檢測進行修正,獲得目標人臉圖片,具體為:
對相似度低于閾值的圖片,進行重檢測;
對檢測到單張人臉的圖片,直接刪除;
對檢測到多個人臉的圖片,分別提取每個人臉的特征,并與基準人臉進行對比獲得相似度,將相似度最大的人臉作為檢測結果;
S4、根據步驟S3的結果,采用采用kruskal算法或Prim算法生成最大生成樹,并剔除不屬于最大生成樹的噪點圖片;
S5、將多個服務器上的數據庫進行融合,構建海量人臉數據庫;每組基準圖片和其他組基準圖片StdImg計算相似度S,如果相似度ST,則進行合并。閾值的設定為機器和手工預先挑選。
S6、消除步驟S5中海量人臉數據庫中的冗余圖片,獲得目標人臉識別數據庫;
重新計算圖片融合后的組內相似度,設定閾值,此閾值代表重復圖片,將高于閾值的圖片刪除,只保留一張,最終消除數據冗余。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西南交通大學,未經西南交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810441046.5/2.html,轉載請聲明來源鉆瓜專利網。





