[發(fā)明專(zhuān)利]圖像識(shí)別方法、裝置及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201711297684.6 | 申請(qǐng)日: | 2017-12-08 |
| 公開(kāi)(公告)號(hào): | CN107992833A | 公開(kāi)(公告)日: | 2018-05-04 |
| 發(fā)明(設(shè)計(jì))人: | 李冉 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京小米移動(dòng)軟件有限公司 |
| 主分類(lèi)號(hào): | G06K9/00 | 分類(lèi)號(hào): | G06K9/00 |
| 代理公司: | 北京英創(chuàng)嘉友知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙)11447 | 代理人: | 魏嘉熹,南毅寧 |
| 地址: | 100085 北京市海淀區(qū)清河*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖像 識(shí)別 方法 裝置 存儲(chǔ) 介質(zhì) | ||
技術(shù)領(lǐng)域
本公開(kāi)涉及通信技術(shù)領(lǐng)域,尤其涉及圖像識(shí)別方法、裝置及存儲(chǔ)介質(zhì)。
背景技術(shù)
圖像識(shí)別解鎖正成為目前移動(dòng)終端設(shè)備解鎖的一種趨勢(shì),用戶僅需拿起移動(dòng)終端設(shè)備對(duì)著自己,即可解鎖終端屏幕,不用輸入密碼或者指紋,操作較為簡(jiǎn)捷方便。但是目前圖像解鎖存在一些欺詐的問(wèn)題,例如針對(duì)人臉解鎖來(lái)說(shuō),如攻擊者使用機(jī)主的照片、視頻或者仿制三維模型進(jìn)行解鎖,從而竊取機(jī)主信息。活體檢測(cè)可用于區(qū)分真實(shí)人臉和欺詐人臉。目前活體檢測(cè)分為基于動(dòng)態(tài)特征和靜態(tài)圖像特征兩種主流檢測(cè)方式。動(dòng)態(tài)活體檢測(cè)要求用戶做出指定動(dòng)作,如睜眼閉眼,點(diǎn)頭搖頭,讀出一段文字等;靜態(tài)活體檢測(cè)則是從圖像特征來(lái)區(qū)分,依據(jù)是欺詐人臉(如照片)經(jīng)過(guò)二次采樣,會(huì)損失部分高頻信息,而且由于反光特性和真實(shí)人臉不同,會(huì)在圖像細(xì)節(jié)上有所體現(xiàn)。從檢測(cè)精確度來(lái)說(shuō),動(dòng)態(tài)活體檢測(cè)更好,但人臉解鎖的場(chǎng)景不適合使用動(dòng)態(tài)活體檢測(cè)方法,因?yàn)樾枰脩糁鲃?dòng)進(jìn)行動(dòng)態(tài)配合,這樣則喪失了人臉識(shí)別解鎖本身所具備的便利性,使得用戶在對(duì)移動(dòng)終端設(shè)備進(jìn)行解鎖的操作變得復(fù)雜,影響了用戶了使用體驗(yàn)。
發(fā)明內(nèi)容
為克服相關(guān)技術(shù)中存在的利用動(dòng)態(tài)活體檢測(cè)方式進(jìn)行圖像識(shí)別操作較為復(fù)雜的問(wèn)題,本公開(kāi)提供一種圖像識(shí)別方法、裝置及存儲(chǔ)介質(zhì)。
根據(jù)本申請(qǐng)的第一個(gè)方面,提供了一種圖像識(shí)別方法,包括:獲取預(yù)設(shè)個(gè)數(shù)的連續(xù)圖像幀中相同位置的目標(biāo)圖像;將所述目標(biāo)圖像輸入預(yù)設(shè)神經(jīng)網(wǎng)絡(luò),得到圖像識(shí)別結(jié)果,其中,所述圖像識(shí)別結(jié)果包括:當(dāng)前檢測(cè)的對(duì)象為活體或非活體。
可選地,所述獲取預(yù)設(shè)個(gè)數(shù)的連續(xù)圖像幀中相同位置的目標(biāo)圖像的步驟,包括:將所述預(yù)設(shè)個(gè)數(shù)的連續(xù)圖像幀中位于中間位置的第一圖像幀進(jìn)行紋理特征識(shí)別,得到第一目標(biāo)圖像;在與所述第一圖像幀相鄰的第二圖像幀以及第三圖像幀中截取與所述第一目標(biāo)圖像位置相同的第二目標(biāo)圖像以及第三目標(biāo)圖像,其中,所述目標(biāo)圖像至少包括所述第一目標(biāo)圖像、所述第二目標(biāo)圖像以及所述第三目標(biāo)圖像。
可選地,所述將所述預(yù)設(shè)個(gè)數(shù)的連續(xù)圖像幀中位于中間位置的第一圖像幀進(jìn)行紋理特征識(shí)別的步驟包括:對(duì)所述第一圖像幀進(jìn)行目標(biāo)對(duì)象區(qū)域分割;將分割得到的目標(biāo)對(duì)象區(qū)域按照預(yù)設(shè)系數(shù)擴(kuò)大,得到所述第一目標(biāo)圖像。
可選地,所述將所述預(yù)設(shè)個(gè)數(shù)的連續(xù)圖像幀中位于中間位置的第一圖像幀進(jìn)行紋理特征識(shí)別的步驟包括:基于所述第一圖像幀建立圖像金字塔;對(duì)所述圖像金字塔中的各層進(jìn)行滑動(dòng)窗口式搜索,提取每個(gè)搜索窗口的Haar特征;將提取到的Haar特征輸入預(yù)先訓(xùn)練得到的分類(lèi)器,獲得分類(lèi)結(jié)果;在所述分類(lèi)結(jié)果大于所述分類(lèi)器的最優(yōu)閾值時(shí),確定當(dāng)前搜索窗口識(shí)別到目標(biāo)對(duì)象區(qū)域;將識(shí)別到的所述目標(biāo)對(duì)象區(qū)域按照預(yù)設(shè)系數(shù)擴(kuò)大,得到所述第一目標(biāo)圖像。
可選地,所述方法還包括:在獲取預(yù)設(shè)個(gè)數(shù)的連續(xù)圖像幀中相同位置的目標(biāo)圖像之前,將所述預(yù)設(shè)個(gè)數(shù)的連續(xù)圖像幀樣本中位于中間位置的第一圖像幀樣本進(jìn)行紋理特征識(shí)別,得到第一目標(biāo)圖像樣本;在與所述第一圖像幀樣本相鄰的第二圖像幀樣本以及第三圖像幀樣本中截取與所述第一目標(biāo)圖像樣本位置相同的第二目標(biāo)圖像樣本以及第三目標(biāo)圖像樣本;對(duì)所述第一目標(biāo)圖像樣本、所述第二目標(biāo)圖像樣本以及所述第三圖像樣本進(jìn)行標(biāo)識(shí),所述標(biāo)識(shí)包括活體標(biāo)識(shí)或非活體標(biāo)識(shí);將標(biāo)識(shí)后的所述第一目標(biāo)圖像樣本、所述第二目標(biāo)圖像樣本以及所述第三目標(biāo)圖像樣本輸入神經(jīng)網(wǎng)絡(luò),進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,得到所述預(yù)設(shè)神經(jīng)網(wǎng)絡(luò)。
可選地,所述方法還包括:在獲取預(yù)設(shè)個(gè)數(shù)的連續(xù)圖像幀中相同位置的目標(biāo)圖像的步驟之前,從視頻數(shù)據(jù)中每隔第一預(yù)設(shè)數(shù)據(jù)的圖像幀抽取第二預(yù)設(shè)數(shù)目的連續(xù)圖像幀。
根據(jù)本公開(kāi)的第二個(gè)方面,提供了一種圖像識(shí)別裝置,包括:獲取模塊,被配置為獲取預(yù)設(shè)個(gè)數(shù)的連續(xù)圖像幀中相同位置的目標(biāo)圖像;第一識(shí)別模塊,被配置為將所述目標(biāo)圖像輸入預(yù)設(shè)神經(jīng)網(wǎng)絡(luò),得到圖像識(shí)別結(jié)果,其中,所述圖像識(shí)別結(jié)果包括:當(dāng)前檢測(cè)的對(duì)象為活體或非活體。
可選地,所述獲取模塊,包括:識(shí)別單元,被配置為將所述預(yù)設(shè)個(gè)數(shù)的連續(xù)圖像幀中位于中間位置的第一圖像幀進(jìn)行紋理特征識(shí)別,得到第一目標(biāo)圖像;截取單元,被配置為在與所述第一圖像幀相鄰的第二圖像幀以及第三圖像幀中截取與所述第一目標(biāo)圖像位置相同的第二目標(biāo)圖像以及第三目標(biāo)圖像,其中,所述目標(biāo)圖像至少包括所述第一目標(biāo)圖像、所述第二目標(biāo)圖像以及所述第三目標(biāo)圖像。
可選地,所述識(shí)別單元包括:分割子單元,被配置為對(duì)所述第一圖像幀進(jìn)行目標(biāo)對(duì)象區(qū)域分割;第一擴(kuò)大子單元,被配置為將分割得到的目標(biāo)對(duì)象區(qū)域按照預(yù)設(shè)系數(shù)擴(kuò)大,得到所述第一目標(biāo)圖像。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京小米移動(dòng)軟件有限公司,未經(jīng)北京小米移動(dòng)軟件有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711297684.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





