[發明專利]圖像識別方法、裝置、計算機設備和存儲介質有效
| 申請號: | 201811625431.1 | 申請日: | 2018-12-28 |
| 公開(公告)號: | CN109886077B | 公開(公告)日: | 2021-07-09 |
| 發明(設計)人: | 張健;萬昭祎;賀欣 | 申請(專利權)人: | 北京曠視科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 北京華進京聯知識產權代理有限公司 11606 | 代理人: | 黃易 |
| 地址: | 100190 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 識別 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種圖像識別方法,其特征在于,所述方法包括:
將原始圖像輸入圖像檢測模型,并根據所述圖像檢測模型的輸出結果得到目標圖像;
將所述目標圖像輸入文本初始檢測模型,得到所述目標圖像中的字段域和字符框;
將得到的所述目標圖像中的字段域輸入字段識別模型,得到所述目標圖像的字段識別結果;
將得到的所述目標圖像中的字符框輸入字符識別模型,得到所述目標圖像的字符識別結果;
根據所述字段識別結果和所述字符識別結果得到圖像識別結果;
所述圖像檢測模型包括第一圖像檢測模型和第二圖像檢測模型,所述將原始圖像輸入圖像檢測模型,并根據所述圖像檢測模型的輸出結果得到目標圖像,包括:
將所述原始圖像輸入第一圖像檢測模型,得到所述原始圖像的特征圖;
根據所述原始圖像的特征圖對所述原始圖像進行修正,得到初始處理圖像;
將所述初始處理圖像輸入第二圖像檢測模型,得到所述初始處理圖像中目標區域的頂點坐標;
根據所述初始處理圖像中目標區域的頂點坐標對所述初始處理圖像進行修正,得到所述目標圖像。
2.根據權利要求1所述的方法,其特征在于,所述將所述原始圖像輸入第一圖像檢測模型,得到所述原始圖像的特征圖;根據所述原始圖像的特征圖對所述原始圖像進行修正,得到初始處理圖像包括:
將所述原始圖像輸入所述第一圖像檢測模型,通過所述第一圖像檢測模型中的特征金字塔網絡對所述原始圖像進行特征提取,得到所述原始圖像中目標區域的熱圖和傾斜角度圖;
根據所述原始圖像中目標區域的熱圖和傾斜角度圖對所述原始圖像進行修正,得到初始處理圖像。
3.根據權利要求1所述的方法,其特征在于,所述第二圖像檢測模型包括:特征提取網絡以及與所述特征提取網絡連接的輸出層,其中,所述特征提取網絡包括ResNet網絡,和/或,ResNet-inception混合網絡。
4.根據權利要求1所述的方法,其特征在于,
若所述第二圖像檢測模型的特征提取層包括ResNet網絡,則所述將所述初始處理圖像輸入第二圖像檢測模型,得到所述初始處理圖像中目標區域的頂點坐標,包括:
通過所述ResNet網絡的ResNet block進行特征提取,得到特征提取結果,并將所述特征提取結果輸入所述第二圖像檢測模型的輸出層,輸出初始處理圖像中目標區域的頂點坐標;和/或,
若所述第二圖像檢測模型的特征提取層包括ResNet-inception混合網絡,則所述將所述初始處理圖像輸入第二圖像檢測模型,得到所述初始處理圖像中目標區域的頂點坐標包括:
通過所述ResNet-inception混合網絡的ResNet block和inception block進行特征提取,得到特征提取結果,并將所述特征提取結果輸入所述第二圖像檢測模型的輸出層,輸出初始處理圖像中目標區域的頂點坐標。
5.根據權利要求1所述的方法,其特征在于,所述文本初始檢測模型包含:EAST模型以及與所述EAST模型的特征提取網絡連接的字段域識別神經網絡;其中,所述字段域識別神經網絡用于基于所述EAST模型的特征提取網絡的輸出結果,進行字段域識別。
6.根據權利要求1所述的方法,其特征在于,所述將所述目標圖像輸入文本初始檢測模型,得到所述目標圖像中的字段域和字符框,包括:
將所述目標圖像輸入文本初始檢測模型,所述文本初始檢測模型中的EAST模型的特征提取網絡對輸入的所述目標圖像進行特征提取,得到所述目標圖像的特征圖;
將所述目標圖像的特征圖輸入所述EAST模型的特征融合層,得到融合后的特征圖,并將所述融合后的特征圖輸入所述EAST模型的輸出層,得到所述目標圖像中的字符框;
將所述目標圖像的特征圖輸入與所述EAST模型的特征提取網絡連接的字段域識別神經網絡,輸出所述目標圖片的字段域檢測結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京曠視科技有限公司,未經北京曠視科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811625431.1/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





