[發(fā)明專利]圖像識別方法、裝置及電子設(shè)備有效
| 申請?zhí)枺?/td> | 201810175904.6 | 申請日: | 2018-03-02 |
| 公開(公告)號: | CN108537115B | 公開(公告)日: | 2022-01-25 |
| 發(fā)明(設(shè)計(jì))人: | 丁威 | 申請(專利權(quán))人: | 創(chuàng)新先進(jìn)技術(shù)有限公司 |
| 主分類號: | G06V20/00 | 分類號: | G06V20/00;G06V10/22;G06V10/50;G06N3/04;G06N3/08;G06V30/28 |
| 代理公司: | 北京博思佳知識產(chǎn)權(quán)代理有限公司 11415 | 代理人: | 林祥 |
| 地址: | 開曼群島大開曼島*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖像 識別 方法 裝置 電子設(shè)備 | ||
1.一種圖像識別方法,用于識別輸入圖像中所具有的一個或多個目標(biāo),所述目標(biāo)包括字符和空格,所述方法包括:
獲取待識別的輸入圖像;
基于設(shè)定的N值或設(shè)定的子塊尺寸,確定所述輸入圖像所包含的N個子塊,提取所述子塊對應(yīng)的圖像特征值,所述圖像特征值描述所述子塊所具有的像素信息,N≥1;其中,一個子塊對應(yīng)目標(biāo)的部分內(nèi)容;
將所述N個子塊及對應(yīng)的圖像特征值作為輸入,利用識別模型確定所述N個子塊所對應(yīng)的目標(biāo);其中,所述識別模型針對第i個子塊,結(jié)合所述輸入圖像中排列在該第i個子塊之前和之后的若干個子塊的圖像特征值,確定該第i個子塊對應(yīng)的目標(biāo);所述識別模型預(yù)先利用樣本圖像包含的目標(biāo)、以及樣本圖像的多個子塊的圖像特征值而訓(xùn)練得到,1≤i≤N;
根據(jù)所述N個子塊所對應(yīng)的目標(biāo),基于所述識別模型確定出的空格,將相鄰的若干個相同的字符合并為一個字符,確定所述輸入圖像中所包含的目標(biāo)。
2.根據(jù)權(quán)利要求1所述的方法,所述確定所述輸入圖像所包含的N個子塊,包括:
將所述輸入圖像平均劃分為所述N個子塊。
3.根據(jù)權(quán)利要求1所述的方法,所述提取所述子塊對應(yīng)的圖像特征值,包括:
利用卷積神經(jīng)網(wǎng)絡(luò)模型提取所述圖像特征值,所述卷積神經(jīng)網(wǎng)絡(luò)模型預(yù)先利用樣本圖像訓(xùn)練得到。
4.根據(jù)權(quán)利要求1所述的方法,所述識別模型包括至少一層雙向循環(huán)神經(jīng)網(wǎng)絡(luò),輸入至所述雙向循環(huán)神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)具有時間順序,所述時間順序?yàn)樗鯪個子塊在所述輸入圖像中的排列順序。
5.根據(jù)權(quán)利要求1所述的方法,所述目標(biāo)包括字符或空格;
所述確定所述輸入圖像中所包含的目標(biāo),還包括:
刪除所述空格后,確定所述輸入圖像中所包含的字符。
6.根據(jù)權(quán)利要求1所述的方法,所述樣本圖像通過如下方式獲得:
獲取包含有至少一個目標(biāo)的真實(shí)圖像,去除所述真實(shí)圖像中的至少一個目標(biāo),在去除位置合成模擬目標(biāo)后添加噪聲,獲得樣本圖像。
7.根據(jù)權(quán)利要求6所述的方法,所述模擬目標(biāo)的生成方式,包括:
根據(jù)不同顏色、字體或字號,生成所述模擬目標(biāo)。
8.一種圖像識別裝置,用于識別輸入圖像中所具有的一個或多個目標(biāo),所述目標(biāo)包括字符和空格,所述裝置包括:
圖像獲取模塊,用于:獲取待識別的輸入圖像;
特征提取模塊,用于:基于設(shè)定的N值或設(shè)定的子塊尺寸,確定所述輸入圖像所包含的N個子塊,提取所述子塊對應(yīng)的圖像特征值,所述圖像特征值描述所述子塊所具有的像素信息,N≥1;其中,一個子塊對應(yīng)目標(biāo)的部分內(nèi)容;
識別模塊,用于:將所述N個子塊及對應(yīng)的圖像特征值作為輸入,利用識別模型確定所述N個子塊所對應(yīng)的目標(biāo);其中,所述識別模型針對第i個子塊,結(jié)合所述輸入圖像中排列在該第i個子塊之前和之后的若干個子塊的圖像特征值,確定該第i個子塊對應(yīng)的目標(biāo);所述識別模型預(yù)先利用樣本圖像包含的目標(biāo)、以及樣本圖像的多個子塊的圖像特征值而訓(xùn)練得到,1≤i≤N;
目標(biāo)確定模塊,用于:根據(jù)所述N個子塊所對應(yīng)的目標(biāo),基于所述識別模型確定出的空格,將相鄰的若干個相同的字符合并為一個字符,確定所述輸入圖像中所包含的目標(biāo)。
9.根據(jù)權(quán)利要求8所述的裝置,所述特征提取模塊,還用于:
將所述輸入圖像平均劃分為所述N個子塊。
10.根據(jù)權(quán)利要求8所述的裝置,所述提取所述子塊對應(yīng)的圖像特征值,包括:
利用卷積神經(jīng)網(wǎng)絡(luò)模型提取所述圖像特征值,所述卷積神經(jīng)網(wǎng)絡(luò)模型預(yù)先利用樣本圖像訓(xùn)練得到。
11.根據(jù)權(quán)利要求8所述的裝置,所述識別模型包括至少一層雙向循環(huán)神經(jīng)網(wǎng)絡(luò),輸入至所述雙向循環(huán)神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)具有時間順序,所述時間順序?yàn)樗鯪個子塊在所述輸入圖像中的排列順序。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于創(chuàng)新先進(jìn)技術(shù)有限公司,未經(jīng)創(chuàng)新先進(jìn)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810175904.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





