[發(fā)明專利]一種圖像識別方法、裝置和存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201811037416.5 | 申請日: | 2018-09-06 |
| 公開(公告)號: | CN110163211B | 公開(公告)日: | 2023-02-28 |
| 發(fā)明(設(shè)計)人: | 劉東澤;楊晨;李浩 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06V30/148 | 分類號: | G06V30/148;G06V30/14;G06V30/146;G06V30/19 |
| 代理公司: | 深圳翼盛智成知識產(chǎn)權(quán)事務(wù)所(普通合伙) 44300 | 代理人: | 黃威 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 圖像 識別 方法 裝置 存儲 介質(zhì) | ||
1.一種圖像識別方法,其特征在于,包括:
采集標(biāo)注后的樣本試卷圖像,所述樣本試卷圖像包括已標(biāo)注的樣本答題區(qū)域和所述樣本試卷的樣本定位點;
獲取所述樣本答題區(qū)域與所述樣本定位點之間的位置關(guān)系;
獲取所述樣本定位點的真實位置值;
基于所述樣本圖像和定位點識別網(wǎng)絡(luò)模型獲取所述樣本定位點的預(yù)測位置值;
采用預(yù)設(shè)損失函數(shù)對所述樣本定位點的預(yù)測位置值和真實位置值進(jìn)行收斂,得到訓(xùn)練后的定位點識別網(wǎng)絡(luò)模型;
采集待識別的試卷圖像,并采用所述訓(xùn)練后的定位點識別網(wǎng)絡(luò)模型識別出試卷的定位點位置;
根據(jù)所述定位點位置和所述位置關(guān)系,從所述試卷圖像中提取答題區(qū)域圖像;
對所述答題區(qū)域圖像進(jìn)行字符識別,得到識別結(jié)果。
2.如權(quán)利要求1所述的圖像識別方法,其特征在于,根據(jù)所述定位點位置和所述位置關(guān)系,從所述試卷圖像中提取答題區(qū)域圖像,包括:
根據(jù)所述定位點位置和所述位置關(guān)系確定答題區(qū)域位置;
根據(jù)所述答題區(qū)域位置從所述試卷圖像中提取答題區(qū)域圖像。
3.如權(quán)利要求1所述的圖像識別方法,其特征在于,對根據(jù)所述定位點位置和所述位置關(guān)系,從所述試卷圖像中提取答題區(qū)域圖像,包括:
根據(jù)所述定位點位置對所述試卷圖像進(jìn)行仿射變換,得到仿射變換后圖像、仿射變換后定位點位置;
根據(jù)所述仿射變換后定位點位置和所述位置關(guān)系,從所述仿射變換后圖像中提取答題區(qū)域圖像。
4.如權(quán)利要求1所述的圖像識別方法,其特征在于,對所述答題區(qū)域圖像進(jìn)行字符識別,得到識別結(jié)果,包括:
采用投影方式從所述答題區(qū)域圖像中切割出字符圖像;
采用訓(xùn)練后的字符識別網(wǎng)絡(luò)模型對所述字符圖像進(jìn)行字符識別,得到識別結(jié)果。
5.如權(quán)利要求4所述的圖像識別方法,其特征在于,采用投影方式從所述答題區(qū)域圖像中切割出字符圖像,包括:
對所述區(qū)域圖像進(jìn)行水平投影,得到水平投影結(jié)果;
根據(jù)所述水平投影結(jié)果對所述區(qū)域圖像進(jìn)行切割,得到若干行子區(qū)域圖像;
對所述子區(qū)域圖像進(jìn)行垂直投影,得到垂直投影結(jié)果;
根據(jù)所述垂直投影結(jié)果對所述子區(qū)域圖像進(jìn)行切割,得到字符圖像。
6.如權(quán)利要求5所述的圖像識別方法,其特征在于,在對所述子區(qū)域圖像進(jìn)行垂直投影之前,所述方法還包括:
根據(jù)預(yù)設(shè)圖像過濾條件對若干行子區(qū)域圖像進(jìn)行過濾,得到過濾后子區(qū)域圖像;
對所述子區(qū)域圖像進(jìn)行垂直投影,包括:對所述過濾后子區(qū)域圖像進(jìn)行垂直投影;
根據(jù)所述垂直投影結(jié)果對所述子區(qū)域圖像進(jìn)行切割,包括:根據(jù)所述垂直投影結(jié)果對所述過濾后子區(qū)域圖像進(jìn)行切割。
7.如權(quán)利要求1所述的圖像識別方法,其特征在于,所述定位點識別網(wǎng)絡(luò)模型包括一個全連接層和至少五個卷積層;
采用所述訓(xùn)練后的定位點識別網(wǎng)絡(luò)模型識別出試卷的定位點位置,包括:
在至少五個卷積層依次對所述試卷圖像進(jìn)行卷積處理,得到卷積處理結(jié)果;
在所述全連接層對所述卷積處理結(jié)果進(jìn)行全連接運算,得到定位點位置。
8.如權(quán)利要求4所述的圖像識別方法,其特征在于,所述字符識別網(wǎng)絡(luò)模型包括:多個卷積層以及兩個全連接層;
采用訓(xùn)練后的字符識別網(wǎng)絡(luò)模型對所述字符圖像進(jìn)行字符識別,包括:
在所述多個卷積層依次對所述字符圖像進(jìn)行卷積處理,得到卷積處理結(jié)果;
在所述兩個全連接層依次對所述卷積處理結(jié)果進(jìn)行字符分類處理。
9.如權(quán)利要求1所述的圖像識別方法,其特征在于,根據(jù)所述定位點位置對所述試卷圖像進(jìn)行仿射變換,包括:
獲取新的定位點位置;
根據(jù)所述定位點位置和所述新的定位點位置,獲取仿射變換矩陣;
根據(jù)所述仿射變換矩陣對所述圖像的像素位置進(jìn)行仿射變換處理。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811037416.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





