[發(fā)明專利]一種圖像識別方法、裝置、設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202011520209.2 | 申請日: | 2020-12-21 |
| 公開(公告)號: | CN112508975A | 公開(公告)日: | 2021-03-16 |
| 發(fā)明(設(shè)計(jì))人: | 王林武 | 申請(專利權(quán))人: | 上海眼控科技股份有限公司 |
| 主分類號: | G06T7/12 | 分類號: | G06T7/12;G06T7/13 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 200030 上海市徐匯*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 圖像 識別 方法 裝置 設(shè)備 存儲 介質(zhì) | ||
1.一種圖像識別方法,其特征在于,包括:
獲取待檢測圖像,并確定所述待檢測圖像對應(yīng)的目標(biāo)輪廓框圖像,所述目標(biāo)輪廓框圖像包含至少一個(gè)目標(biāo)輪廓框;
將所述目標(biāo)輪廓框圖像輸入至目標(biāo)分割網(wǎng)絡(luò)模型中,獲得所述目標(biāo)分割網(wǎng)絡(luò)模型輸出的各所述目標(biāo)輪廓框所對應(yīng)的至少一個(gè)目標(biāo)偏移量,其中,所述目標(biāo)分割網(wǎng)絡(luò)模型通過對預(yù)先所構(gòu)建待訓(xùn)練分割網(wǎng)絡(luò)模型的訓(xùn)練獲得;
根據(jù)各所述目標(biāo)偏移量調(diào)整所述目標(biāo)輪廓框中對應(yīng)的各輪廓點(diǎn)的位置,得到目標(biāo)圖像。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定待檢測圖像對應(yīng)的目標(biāo)輪廓框圖像,包括:
將所述待檢測圖像輸入到預(yù)確定的檢測框確定模型中,得到包含至少一個(gè)檢測框的檢測框圖像;
根據(jù)各所述檢測框的坐標(biāo)進(jìn)行輪廓篩選,得到輪廓框圖像;
將所述輪廓框圖像按照設(shè)定尺寸進(jìn)行縮放,得到目標(biāo)輪廓框圖像。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述待訓(xùn)練分割網(wǎng)絡(luò)模型包括設(shè)定數(shù)量用于輪廓點(diǎn)特征表示確定的輪廓點(diǎn)特征學(xué)習(xí)模塊,所述輪廓點(diǎn)特征學(xué)習(xí)模塊包括循環(huán)卷積單元和自注意力機(jī)制單元;
相應(yīng)的,所述目標(biāo)分割網(wǎng)絡(luò)模型的確定步驟包括:
將獲取的圖像訓(xùn)練樣本輸入給定的待訓(xùn)練分割網(wǎng)絡(luò)模型,得到所述設(shè)定數(shù)量的特征預(yù)測圖像,所述特征預(yù)測圖像包括至少一個(gè)目標(biāo)輪廓點(diǎn)的特征表示;
對各所述特征預(yù)測圖像進(jìn)行特征融合,得到包含至少一個(gè)融合輪廓點(diǎn)的特征融合圖像;
對所述特征融合圖像進(jìn)行卷積運(yùn)算,得到各融合輪廓點(diǎn)的預(yù)測偏移量;
采用給定的損失函數(shù)表達(dá)式,結(jié)合所述預(yù)測偏移量、圖像訓(xùn)練樣本對應(yīng)的標(biāo)準(zhǔn)偏移量,確定損失函數(shù);
通過所述損失函數(shù)對所述待訓(xùn)練分割網(wǎng)絡(luò)模型進(jìn)行反向傳播,得到目標(biāo)分割網(wǎng)絡(luò)模型。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述將獲取的圖像訓(xùn)練樣本輸入給定的待訓(xùn)練分割網(wǎng)絡(luò)模型,得到設(shè)定數(shù)量的特征預(yù)測圖像,包括:
將待訓(xùn)練分割網(wǎng)絡(luò)模型的首個(gè)輪廓點(diǎn)特征學(xué)習(xí)模塊作為當(dāng)前輪廓點(diǎn)特征學(xué)習(xí)模塊,圖像訓(xùn)練樣本作為當(dāng)前輸入數(shù)據(jù);
將所述當(dāng)前輸入數(shù)據(jù)輸入到當(dāng)前輪廓點(diǎn)特征學(xué)習(xí)模塊中,得到特征預(yù)測圖像;
如果所述當(dāng)前輪廓點(diǎn)特征學(xué)習(xí)模塊存在下一模塊,將所述特征預(yù)測圖像作為新的當(dāng)前輸入數(shù)據(jù),所述當(dāng)前輪廓點(diǎn)特征學(xué)習(xí)模塊的下一模塊作為新的當(dāng)前輪廓點(diǎn)特征學(xué)習(xí)模塊,返回執(zhí)行特征預(yù)測圖像的確定操作。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述將所述當(dāng)前輸入數(shù)據(jù)輸入到當(dāng)前輪廓點(diǎn)特征學(xué)習(xí)模塊中,得到特征預(yù)測圖像,包括:
將所述當(dāng)前輸入數(shù)據(jù)輸入到所述循環(huán)卷積單元中,得到卷積特征圖像;
將所述卷積特征圖像輸入到所述自注意力機(jī)制單元中,根據(jù)所述卷積特征圖像的尺寸參數(shù)、設(shè)定數(shù)量的卷積模板及維度轉(zhuǎn)換函數(shù)進(jìn)行矩陣變換,得到變換特征圖像;
對所述卷積特征圖像和變換特征圖像進(jìn)行通道拼接,得到對應(yīng)的特征預(yù)測圖像。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述根據(jù)所述卷積特征圖像的尺寸參數(shù)、設(shè)定數(shù)量的卷積模板及維度轉(zhuǎn)換函數(shù)進(jìn)行矩陣變換,得到變換特征圖像,包括:
對所述卷積特征圖像的尺寸參數(shù)中的通道個(gè)數(shù)進(jìn)行降維處理,得到降維特征圖像;
根據(jù)所述降維特征圖像及設(shè)定數(shù)量的卷積模板進(jìn)行卷積運(yùn)算,得到設(shè)定數(shù)量的卷積運(yùn)算圖像;
根據(jù)所述維度轉(zhuǎn)換函數(shù)對各所述卷積運(yùn)算圖像進(jìn)行維度變換,并將各維度變換后的卷積運(yùn)算圖像進(jìn)行綜合處理得到維度變換圖像;
將所述降維變換圖像的尺寸參數(shù)中的通道個(gè)數(shù)進(jìn)行升維處理,得到升維后的變換特征圖像。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)各所述目標(biāo)偏移量調(diào)整目標(biāo)輪廓框中對應(yīng)的各輪廓點(diǎn)的位置,得到目標(biāo)圖像,包括:
將目標(biāo)輪廓框中的各輪廓點(diǎn)按照對應(yīng)的所述目標(biāo)偏移量進(jìn)行移動(dòng),得到移動(dòng)后的各輪廓點(diǎn);
將包含所述移動(dòng)后的各輪廓點(diǎn)的圖像作為目標(biāo)圖像。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海眼控科技股份有限公司,未經(jīng)上海眼控科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011520209.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種直流充電纜模擬使用測試裝置
- 下一篇:一種吊籃懸掛機(jī)構(gòu)
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





