[發(fā)明專(zhuān)利]一種基于深度學(xué)習(xí)特征的人臉樣本清洗方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201611146140.5 | 申請(qǐng)日: | 2016-12-13 |
| 公開(kāi)(公告)號(hào): | CN106650804B | 公開(kāi)(公告)日: | 2018-12-11 |
| 發(fā)明(設(shè)計(jì))人: | 劉榮杰;牟永強(qiáng);田第鴻 | 申請(qǐng)(專(zhuān)利權(quán))人: | 深圳云天勵(lì)飛技術(shù)有限公司 |
| 主分類(lèi)號(hào): | G06K9/62 | 分類(lèi)號(hào): | G06K9/62;G06K9/00 |
| 代理公司: | 深圳市科吉華烽知識(shí)產(chǎn)權(quán)事務(wù)所(普通合伙) 44248 | 代理人: | 李利 |
| 地址: | 518000 廣東省深圳市龍崗區(qū)橫崗*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 學(xué)習(xí) 特征 樣本 清洗 方法 系統(tǒng) | ||
本發(fā)明適用于數(shù)據(jù)挖掘及樣本清洗領(lǐng)域,提供了一種基于深度學(xué)習(xí)特征的人臉樣本清洗方法,所述人臉樣本清洗方法包括以下步驟:A、利用深度學(xué)習(xí)技術(shù)對(duì)人臉圖像特征進(jìn)行提取;B、根據(jù)給定的進(jìn)程數(shù)對(duì)需要進(jìn)行處理的樣本進(jìn)行劃分,并分配至每個(gè)進(jìn)程;C、對(duì)每個(gè)進(jìn)程中相應(yīng)的人臉特征進(jìn)行聚類(lèi)處理;D、在每個(gè)聚類(lèi)結(jié)果中選取圖像數(shù)量最多的類(lèi)作為主類(lèi);E、將主類(lèi)特征對(duì)應(yīng)圖像拷貝至目標(biāo)目錄并保留原有文件結(jié)構(gòu)。深度學(xué)習(xí)提取的人臉特征維度低而且具有非常好的鑒別能力,一方面可以提高樣本的清洗精度,另一方面也可以節(jié)約清洗時(shí)間;多進(jìn)程并行設(shè)計(jì),能夠充分利用硬件的運(yùn)算能力,從而提高整個(gè)運(yùn)算的效率,降低耗時(shí)。
技術(shù)領(lǐng)域
本發(fā)明屬于數(shù)據(jù)挖掘及樣本清洗領(lǐng)域,所使用的技術(shù)基于圖像處理和機(jī)器學(xué)習(xí),尤其涉及一種基于深度學(xué)習(xí)特征的人臉樣本清洗方法及系統(tǒng)。
背景技術(shù)
深度學(xué)習(xí)提取人臉特征: 深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)分支,它基于試圖使用包含復(fù)雜結(jié)構(gòu)或由多重非線性變換構(gòu)成的多個(gè)處理層對(duì)數(shù)據(jù)進(jìn)行高層抽象的一系列算法。一個(gè)觀測(cè)值(例如一幅圖像)可以使用多種方式來(lái)表示,如每個(gè)像素強(qiáng)度值的向量,或者更抽象地表示成一系列邊、特定形狀的區(qū)域等。而使用某些特定的表示方法更加容易地從實(shí)例中學(xué)習(xí)任務(wù)(例如,人臉識(shí)別或面部表情識(shí)別)。
DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚類(lèi)算法:是一個(gè)比較有代表性的基于密度的非監(jiān)督式聚類(lèi)算法。與劃分和層次聚類(lèi)方法不同,它將簇定義為密度相連的點(diǎn)的最大集合,能夠把具有足夠高密度的區(qū)域劃分為簇,并可在噪聲的空間數(shù)據(jù)庫(kù)中發(fā)現(xiàn)任意形狀的聚類(lèi)。
多進(jìn)程并行運(yùn)算:當(dāng)用戶敲入命令執(zhí)行一個(gè)程序的時(shí)候,對(duì)系統(tǒng)而言,它將啟動(dòng)一個(gè)進(jìn)程。但和程序不同的是,在這個(gè)進(jìn)程中,系統(tǒng)可能需要再啟動(dòng)一個(gè)或多個(gè)進(jìn)程來(lái)完成獨(dú)立的多個(gè)任務(wù)。多進(jìn)程編程的主要內(nèi)容包括進(jìn)程控制和進(jìn)程間通信,利用多進(jìn)程能夠?qū)⒁粋€(gè)大型的任務(wù)拆分成多個(gè)小任務(wù)交給多個(gè)進(jìn)程同時(shí)處理,從而成倍地提高運(yùn)算速度。
現(xiàn)有技術(shù)方案:a). 特征提取:
i. 方向梯度直方圖(Histogram of Oriented Gradient, HOG)特征: 是一種在計(jì)算機(jī)視覺(jué)和圖像處理中用來(lái)進(jìn)行物體檢測(cè)的特征描述子。它通過(guò)計(jì)算和統(tǒng)計(jì)圖像局部區(qū)域的梯度方向直方圖來(lái)構(gòu)成特征。
ii. Gabor特征提取:Gabor 濾波器定義為:其脈沖響應(yīng)為一個(gè)諧波函數(shù)(即下式中的余弦函數(shù))和一個(gè)高斯函數(shù)的乘積。根據(jù)信號(hào)與系統(tǒng)理論,時(shí)頻域的卷積和乘積互為傅里葉變換。Gabor濾波器的傅里葉變換為諧波和高斯函數(shù)各自傅里葉變換的卷積。它的小波特性說(shuō)明了Gabor濾波結(jié)果是描述圖像局部灰度分布的有力工具, 因此, 可以使用Gabor濾波來(lái)抽取圖像的紋理信息。
b). 人臉?lè)诸?lèi)方法:
i. 支持向量機(jī)SVM (Support Vector Machine): 是一個(gè)有監(jiān)督的學(xué)習(xí)模型,通常用來(lái)進(jìn)行模式識(shí)別、分類(lèi)、以及回歸分析。SVM的主要思想可以概括為兩點(diǎn):⑴它是針對(duì)線性可分情況進(jìn)行分析,對(duì)于線性不可分的情況,通過(guò)使用非線性映射算法將低維輸入空間線性不可分的樣本轉(zhuǎn)化為高維特征空間使其線性可分,從而使得高維特征空間采用線性算法對(duì)樣本的非線性特征進(jìn)行線性分析成為可能;⑵它基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化理論之上在特征空間中建構(gòu)最優(yōu)分割超平面,使得學(xué)習(xí)器得到全局最優(yōu)化,并且在整個(gè)樣本空間的期望風(fēng)險(xiǎn)以某個(gè)概率滿足一定上界。
ii. KNNK最鄰近結(jié)點(diǎn)算法(k-Nearest Neighbor algorithm):該算法的基本思路是:在給定新圖像后,考慮在訓(xùn)練圖像集中與該新圖像距離最近(最相似)的 K 個(gè)圖像,根據(jù)這 K 個(gè)圖像所屬的類(lèi)別判定新圖像所屬的類(lèi)別。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于深圳云天勵(lì)飛技術(shù)有限公司,未經(jīng)深圳云天勵(lì)飛技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611146140.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:一種計(jì)算字符串間相似度的方法及裝置
- 下一篇:羽絨被
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





