[發(fā)明專利]一種金絲猴面部圖像識別方法、裝置、設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202010645419.8 | 申請日: | 2020-07-07 |
| 公開(公告)號: | CN111950362A | 公開(公告)日: | 2020-11-17 |
| 發(fā)明(設(shè)計)人: | 郭松濤;許鵬飛;常江;何剛;李保國;賀樹軍;趙玄潤 | 申請(專利權(quán))人: | 西北大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 西安恒泰知識產(chǎn)權(quán)代理事務(wù)所 61216 | 代理人: | 李婷 |
| 地址: | 710069 *** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 金絲猴 面部 圖像 識別 方法 裝置 設(shè)備 存儲 介質(zhì) | ||
本發(fā)明公開一種一種金絲猴面部圖像識別方法,將采集得到的金絲猴圖像,通過對金絲猴圖像面部區(qū)域截取及預(yù)處理,獲得金絲猴面部圖像數(shù)據(jù)集;將金絲猴面部圖像數(shù)據(jù)集輸入至Tri?Attention神經(jīng)網(wǎng)絡(luò)模型,提取金絲猴特征,完成對金絲猴面部圖像識別。本發(fā)明提出了基于Tri?Attention的金絲猴面部識別算法。該算法能夠自動的關(guān)注金絲猴的面部區(qū)域,不需要對數(shù)據(jù)進行手工標注。該算法采用了空間注意力機制,分別對金絲猴面部圖像的全局特征、局部特征以及顯著性特征進行關(guān)注。通過聯(lián)合不同維度、不同粒度的特征,進行融合,以提高分類的準確度,提升了網(wǎng)絡(luò)的泛化性能。
技術(shù)領(lǐng)域
本發(fā)明屬于計算機視覺領(lǐng)域,具體涉及金絲猴面部圖像識別方法、裝置、設(shè)備及存儲介質(zhì)。
背景技術(shù)
針對金絲猴的研究,首先需要對金絲猴進行監(jiān)測。在傳統(tǒng)的監(jiān)測方法中,主要包括人員實地追蹤監(jiān)測、儀器追蹤監(jiān)測。由于金絲猴生活地的地形相對復(fù)雜,不利于研究人員長期進行實地追蹤監(jiān)測。而采用儀器追蹤監(jiān)測,在一定程度上可以解決上述難題。采用儀器追蹤監(jiān)測方法,方便且高效,但需要在金絲猴身體上綁定跟蹤儀器,這可能會影響到金絲猴個體的生活習性和行為活動,因此該方法具有一定的局限性。隨著科學技術(shù)的發(fā)展,特別是數(shù)碼影像技術(shù)的發(fā)展,金絲猴的監(jiān)測問題得到了有效的解決。由于數(shù)碼影像技術(shù)具有非接觸性的優(yōu)點,已經(jīng)被廣泛的應(yīng)用在各種野生動物的監(jiān)測活動中。。采用數(shù)碼影像技術(shù)進行金絲猴活動監(jiān)測,可以實時的獲取到金絲猴的圖像數(shù)據(jù),而這些圖像數(shù)據(jù)對于研究金絲猴的生活習性、種群結(jié)構(gòu)和種群密度等具有重要的意義。
針對金絲猴的研究,還需要對金絲猴個體進行準確的識別。只有建立在準確無誤的個體識別之上,才能夠了解個體的生活習性并建立準確的社會結(jié)構(gòu)模型。因此,個體識別顯得尤為重要。針對金絲猴識別,可以利用金絲猴五官以及毛發(fā)之間的差異進行識別。人眼識別是最常用的方法,但易受外界因素以及自身因素的影響,帶有一定的主觀性。相比于人眼識別,標記法則具有很高的識別準確度。采用標記法需要在金絲猴身體上進行標記,例如項圈或者色彩。但該方法帶有一定的侵入性,會影響到金絲猴的群居生活,更甚者會對金絲猴個體造成傷害。隨著金絲猴圖像數(shù)據(jù)的增多,怎樣快速的識別并處理圖像數(shù)據(jù)也是一個難題。傳統(tǒng)的識別方法需要消耗大量的人力和時間,導(dǎo)致金絲猴圖像數(shù)據(jù)得不到及時的、準確的處理。針對金絲猴圖像數(shù)據(jù),如何快速的、準確的識別出金絲猴個體顯得尤為重要。
隨著計算機視覺技術(shù)的發(fā)展,針對野生動物圖像的研究已經(jīng)取得了豐碩成果,而深度學習技術(shù)在其中起著重要的作用。深度學習網(wǎng)絡(luò),特別是卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)已經(jīng)在圖像處理、圖像分類等領(lǐng)域取得了巨大的成功。目前,在人臉識別方向,應(yīng)用深度學習技術(shù)的識別準確度已超越了人類的肉眼識別,這為金絲猴面部識別提供了一個解決思路。由于金絲猴和人的五官特征有著很大的相似性,因此可以將人臉識別算法應(yīng)用在金絲猴的面部識別之上。與傳統(tǒng)識別方法相比,應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)進行金絲猴面部識別有很多優(yōu)勢。首先,應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)進行金絲猴識別可以提高識別的準確度,有效克服了人眼識別中由主觀因素帶來的影響。其次,應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)可以快速的識別出金絲猴個體,極大的提高了識別效率,減少了處理時間。
應(yīng)用深度學習技術(shù)進行金絲猴面部識別,也存在著諸多挑戰(zhàn)。首先,由于是在非限制性環(huán)境下采集數(shù)據(jù),因此圖像中難免會包含過多的背景。而針對金絲猴面部識別,背景因素作為干擾特征會影響到算法識別準確度。其次,由于拍攝角度的限制,導(dǎo)致圖像中存在著大量遮擋,如樹葉、山石以及金絲猴個體的相互遮擋。這些遮擋因素會導(dǎo)致金絲猴部分特征丟失,且引入了其他干擾特征。在不同的光照條件下,同一個體在視覺上會存在很大的差異,導(dǎo)致類內(nèi)差異變大。同時,采集到的數(shù)據(jù)中存在大量的側(cè)臉,而側(cè)臉數(shù)據(jù)只包含金絲猴個體的部分特征,不利于深度學習的特征提取。上述這些因素都是自然因素,是隨機的、不可控的且不穩(wěn)定的。相比于自然因素,金絲猴個體的內(nèi)在因素則是相對穩(wěn)定的,但內(nèi)在的相似性卻是金絲猴面部識別面臨的最大難題。部分金絲猴個體在外觀上擁有著極高的相似度,這就需要深度學習模型能夠提取到具有顯著區(qū)分性的特征,這為深度學習算法提出了更高的要求。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西北大學,未經(jīng)西北大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010645419.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





