[發(fā)明專利]一種大規(guī)模人臉模式分析樣本庫的構(gòu)建方法和裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201410808371.2 | 申請(qǐng)日: | 2014-12-19 |
| 公開(公告)號(hào): | CN104778481A | 公開(公告)日: | 2015-07-15 |
| 發(fā)明(設(shè)計(jì))人: | 翟懿奎;甘俊英;王斌;彭超;曾軍英 | 申請(qǐng)(專利權(quán))人: | 五邑大學(xué) |
| 主分類號(hào): | G06K9/66 | 分類號(hào): | G06K9/66;G06K9/46 |
| 代理公司: | 廣州嘉權(quán)專利商標(biāo)事務(wù)所有限公司 44205 | 代理人: | 譚志強(qiáng) |
| 地址: | 529020*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 大規(guī)模 模式 分析 樣本 構(gòu)建 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種大規(guī)模人臉模式分析樣本庫的構(gòu)建方法和裝置,屬于計(jì)算機(jī)圖像處理以及模式識(shí)別技術(shù)領(lǐng)域。
背景技術(shù)
在大數(shù)據(jù)和人工智能的背景下,如何獲取、存儲(chǔ)和處理規(guī)模龐大的數(shù)據(jù)是個(gè)有很強(qiáng)挑戰(zhàn)性的問題。在研究智能算法和工程實(shí)踐的過程中,實(shí)驗(yàn)樣本是訓(xùn)練和評(píng)測(cè)智能算法的重要工具,實(shí)驗(yàn)樣本的規(guī)模甚至比算法模型的精妙設(shè)計(jì)更為重要。目前相關(guān)領(lǐng)域的科研人員和工程師們普遍手工建立人臉庫,其過程耗時(shí)耗力,嚴(yán)重限制了樣本庫的規(guī)模和擴(kuò)展。
當(dāng)今用于人臉模式分析的樣本庫的規(guī)模普遍偏小。一方面,規(guī)模過小的樣本庫帶來的問題在于,不能充分訓(xùn)練算法并且實(shí)驗(yàn)結(jié)果不夠客觀可靠。另一方面,隨著深度網(wǎng)絡(luò)理論的提出及其成功應(yīng)用于人臉識(shí)別等領(lǐng)域,亟待解決的問題是如何才能夠建立大規(guī)模有標(biāo)記和無標(biāo)記人臉模式分析樣本庫去充分?jǐn)M合深度模型。因此存在簡(jiǎn)單易實(shí)現(xiàn)且效率較高的用于自動(dòng)獲取人臉樣本的需求,需要減少實(shí)驗(yàn)人員在建立樣本庫時(shí)的主觀介入,使樣本庫的建立更客觀更科學(xué)。
發(fā)明內(nèi)容
為了解決上述問題,本文結(jié)合圖像處理和模式識(shí)別技術(shù)提供一種大規(guī)模人臉模式分析樣本庫的構(gòu)建方法和裝置,通過構(gòu)建自動(dòng)樣本收集和處理的流程框架,將樣本庫建立過程中大部分的工作量交由計(jì)算機(jī)自動(dòng)處理,從而最大程度上避免科研人員花費(fèi)大量的時(shí)間和精力在繁瑣的重復(fù)性工作上。
本發(fā)明采用的技術(shù)方案為:一種大規(guī)模人臉模式分析樣本庫的構(gòu)建方法,包括如下步驟:A、通過本地和/或遠(yuǎn)程網(wǎng)絡(luò)批量獲取圖片;B、采用基于Harr-like特征的Viola-Jones人臉檢測(cè)算法對(duì)獲取的圖片進(jìn)行人臉檢測(cè)并進(jìn)行篩選,保留包含人臉的圖片;C、基于人臉比例對(duì)包含人臉的圖片進(jìn)行自適應(yīng)圖片分辨率的剪裁,并使包含人臉的圖片歸一化到預(yù)設(shè)的尺寸;D、采用主成分分析法和線性判別分析方法融合的算法對(duì)裁剪的圖片進(jìn)行性別分類以得到不同性別的人臉圖片庫;E、分別在不同性別的人臉圖片庫中,對(duì)圖片進(jìn)行灰度直方圖的相似度比對(duì)以確定重復(fù)的圖片,然后刪除重復(fù)的圖片,并且輸出建立好的人臉樣本庫;F、根據(jù)需要對(duì)建立好的人臉樣本庫進(jìn)行二次篩選和人工標(biāo)記,然后儲(chǔ)存適用的人臉樣本庫至本地存儲(chǔ)器。
進(jìn)一步,所述步驟A包括:利用網(wǎng)絡(luò)爬蟲腳本從本地和/或遠(yuǎn)程網(wǎng)絡(luò)批量獲取圖片,其中基于廣度優(yōu)先策略使網(wǎng)絡(luò)爬蟲執(zhí)行路徑檢索,在預(yù)設(shè)的網(wǎng)絡(luò)路徑抓取所有與統(tǒng)一資源定位符(URL)所對(duì)應(yīng)的圖片,從而控制抓取效率和圖片的來源。
進(jìn)一步,所述步驟C包括:在包含人臉的圖片上會(huì)生成矩形標(biāo)定框;根據(jù)圖片中的人臉尺寸和位置來設(shè)置標(biāo)定框的位置、寬度和高度;根據(jù)標(biāo)定框裁剪圖片。
優(yōu)選地,所述步驟C還包括:在預(yù)設(shè)數(shù)量的人臉圖片中計(jì)算眉毛到下嘴唇間的垂直距離與眉毛到頭頂距離的垂直距離的比值以及眉毛到下嘴唇的垂直距離與下嘴唇到下巴的垂直距離的比值;經(jīng)過統(tǒng)計(jì)分析得出適用的比值數(shù)據(jù),用于確定所述矩形標(biāo)定框的裁剪系數(shù)以實(shí)現(xiàn)標(biāo)定框的縮放。
進(jìn)一步,所述步驟D包括:在采用主成分分析法進(jìn)行數(shù)據(jù)降維處理過程中,維數(shù)是由的已知性別圖片的訓(xùn)練樣本集的協(xié)方差矩陣的97%以上的矩陣特征值的個(gè)數(shù)來確定。
進(jìn)一步,所述步驟E包括:分別計(jì)算基準(zhǔn)圖片和待比對(duì)圖片的灰度直方圖;分別在基準(zhǔn)圖片和待比對(duì)圖片的灰度直方圖中獲取對(duì)應(yīng)的灰度級(jí)像素的頻率值,并且計(jì)算基準(zhǔn)圖片和待比對(duì)圖片的灰度級(jí)像素的頻率值之間的巴氏系數(shù);如果計(jì)算的巴氏系數(shù)值超過預(yù)設(shè)的閥值,則認(rèn)定基準(zhǔn)圖片和待比對(duì)圖片為重復(fù)圖片。
優(yōu)選地,所述的大規(guī)模人臉模式分析樣本庫的構(gòu)建方法,其特征在于所述方法還包括:在采用主成分分析法和線性判別分析方法融合的算法對(duì)裁剪的圖片進(jìn)行性別分類以得到不同性別的人臉圖片庫之后,對(duì)人臉進(jìn)行校準(zhǔn)使人臉處于規(guī)范化的位置和姿態(tài)。
優(yōu)選地,對(duì)人臉進(jìn)行校準(zhǔn)使圖像中的人臉處于規(guī)范化的位置和姿態(tài)的步驟還包括:采用已獲取到的包含人臉的圖片作為訓(xùn)練集并利用無監(jiān)督聯(lián)合校準(zhǔn)算法對(duì)人臉進(jìn)行校準(zhǔn)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于五邑大學(xué),未經(jīng)五邑大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410808371.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 樣本引入裝置、樣本引入基片和樣本引入方法
- 樣本查找方法、裝置及系統(tǒng)
- 模型訓(xùn)練、樣本平衡方法及裝置以及個(gè)人信用評(píng)分系統(tǒng)
- 樣本輸送系統(tǒng)、樣本輸送方法以及樣本檢測(cè)系統(tǒng)
- 樣本分析裝置、樣本檢測(cè)設(shè)備及樣本檢測(cè)方法
- 樣本檢測(cè)方法、樣本檢測(cè)裝置及樣本檢測(cè)系統(tǒng)
- 樣本架、樣本混勻系統(tǒng)及樣本分析儀
- 樣本收集管及樣本收集系統(tǒng)
- 樣本數(shù)據(jù)集的擴(kuò)容方法及模型的訓(xùn)練方法
- 行人重識(shí)別的噪聲樣本識(shí)別方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)





