[發(fā)明專利]一種圖像識別方法、裝置和存儲介質(zhì)有效

申請?zhí)枺?/td>	201811037416.5	申請日：	2018-09-06
公開（公告）號：	CN110163211B	公開（公告）日：	2023-02-28
發(fā)明（設(shè)計）人：	劉東澤;楊晨;李浩	申請（專利權(quán)）人：	騰訊科技（深圳）有限公司
主分類號：	G06V30/148	分類號：	G06V30/148;G06V30/14;G06V30/146;G06V30/19
代理公司：	深圳翼盛智成知識產(chǎn)權(quán)事務(wù)所(普通合伙) 44300	代理人：	黃威
地址：	518057 廣東省深圳***	國省代碼：	廣東;44
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種圖像識別方法裝置存儲介質(zhì)
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種圖像識別方法，其特征在于，包括：

采集標(biāo)注后的樣本試卷圖像，所述樣本試卷圖像包括已標(biāo)注的樣本答題區(qū)域和所述樣本試卷的樣本定位點；

獲取所述樣本答題區(qū)域與所述樣本定位點之間的位置關(guān)系；

獲取所述樣本定位點的真實位置值；

基于所述樣本圖像和定位點識別網(wǎng)絡(luò)模型獲取所述樣本定位點的預(yù)測位置值；

采用預(yù)設(shè)損失函數(shù)對所述樣本定位點的預(yù)測位置值和真實位置值進(jìn)行收斂，得到訓(xùn)練后的定位點識別網(wǎng)絡(luò)模型；

采集待識別的試卷圖像，并采用所述訓(xùn)練后的定位點識別網(wǎng)絡(luò)模型識別出試卷的定位點位置；

根據(jù)所述定位點位置和所述位置關(guān)系，從所述試卷圖像中提取答題區(qū)域圖像；

對所述答題區(qū)域圖像進(jìn)行字符識別，得到識別結(jié)果。

2.如權(quán)利要求1所述的圖像識別方法，其特征在于，根據(jù)所述定位點位置和所述位置關(guān)系，從所述試卷圖像中提取答題區(qū)域圖像，包括：

根據(jù)所述定位點位置和所述位置關(guān)系確定答題區(qū)域位置；

根據(jù)所述答題區(qū)域位置從所述試卷圖像中提取答題區(qū)域圖像。

3.如權(quán)利要求1所述的圖像識別方法，其特征在于，對根據(jù)所述定位點位置和所述位置關(guān)系，從所述試卷圖像中提取答題區(qū)域圖像，包括：

根據(jù)所述定位點位置對所述試卷圖像進(jìn)行仿射變換，得到仿射變換后圖像、仿射變換后定位點位置；

根據(jù)所述仿射變換后定位點位置和所述位置關(guān)系，從所述仿射變換后圖像中提取答題區(qū)域圖像。

4.如權(quán)利要求1所述的圖像識別方法，其特征在于，對所述答題區(qū)域圖像進(jìn)行字符識別，得到識別結(jié)果，包括：

采用投影方式從所述答題區(qū)域圖像中切割出字符圖像；

采用訓(xùn)練后的字符識別網(wǎng)絡(luò)模型對所述字符圖像進(jìn)行字符識別，得到識別結(jié)果。

5.如權(quán)利要求4所述的圖像識別方法，其特征在于，采用投影方式從所述答題區(qū)域圖像中切割出字符圖像，包括：

對所述區(qū)域圖像進(jìn)行水平投影，得到水平投影結(jié)果；

根據(jù)所述水平投影結(jié)果對所述區(qū)域圖像進(jìn)行切割，得到若干行子區(qū)域圖像；

對所述子區(qū)域圖像進(jìn)行垂直投影，得到垂直投影結(jié)果；

根據(jù)所述垂直投影結(jié)果對所述子區(qū)域圖像進(jìn)行切割，得到字符圖像。

6.如權(quán)利要求5所述的圖像識別方法，其特征在于，在對所述子區(qū)域圖像進(jìn)行垂直投影之前，所述方法還包括：

根據(jù)預(yù)設(shè)圖像過濾條件對若干行子區(qū)域圖像進(jìn)行過濾，得到過濾后子區(qū)域圖像；

對所述子區(qū)域圖像進(jìn)行垂直投影，包括：對所述過濾后子區(qū)域圖像進(jìn)行垂直投影；

根據(jù)所述垂直投影結(jié)果對所述子區(qū)域圖像進(jìn)行切割，包括：根據(jù)所述垂直投影結(jié)果對所述過濾后子區(qū)域圖像進(jìn)行切割。

7.如權(quán)利要求1所述的圖像識別方法，其特征在于，所述定位點識別網(wǎng)絡(luò)模型包括一個全連接層和至少五個卷積層；

采用所述訓(xùn)練后的定位點識別網(wǎng)絡(luò)模型識別出試卷的定位點位置，包括：

在至少五個卷積層依次對所述試卷圖像進(jìn)行卷積處理，得到卷積處理結(jié)果；

在所述全連接層對所述卷積處理結(jié)果進(jìn)行全連接運算，得到定位點位置。

8.如權(quán)利要求4所述的圖像識別方法，其特征在于，所述字符識別網(wǎng)絡(luò)模型包括：多個卷積層以及兩個全連接層；

采用訓(xùn)練后的字符識別網(wǎng)絡(luò)模型對所述字符圖像進(jìn)行字符識別，包括：

在所述多個卷積層依次對所述字符圖像進(jìn)行卷積處理，得到卷積處理結(jié)果；

在所述兩個全連接層依次對所述卷積處理結(jié)果進(jìn)行字符分類處理。

9.如權(quán)利要求1所述的圖像識別方法，其特征在于，根據(jù)所述定位點位置對所述試卷圖像進(jìn)行仿射變換，包括：

獲取新的定位點位置；

根據(jù)所述定位點位置和所述新的定位點位置，獲取仿射變換矩陣；

根據(jù)所述仿射變換矩陣對所述圖像的像素位置進(jìn)行仿射變換處理。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技（深圳）有限公司，未經(jīng)騰訊科技（深圳）有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201811037416.5/1.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：一種興趣點POI信息采集方法、裝置、設(shè)備和存儲介質(zhì)
下一篇：一種碑帖圖像中的文字切割方法

同類專利

專利分類

G 物理

G06 計算；推算；計數(shù)

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點擊【登陸】【注冊】