[發明專利]一種圖像識別方法、裝置、電子設備及存儲介質在審
| 申請號: | 202110359351.1 | 申請日: | 2021-04-02 |
| 公開(公告)號: | CN113011409A | 公開(公告)日: | 2021-06-22 |
| 發明(設計)人: | 單海蛟;何小坤;熊澤法 | 申請(專利權)人: | 北京世紀好未來教育科技有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/32;G06K9/34;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京開陽星知識產權代理有限公司 11710 | 代理人: | 張子青 |
| 地址: | 100089 北京市海淀區中*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖像 識別 方法 裝置 電子設備 存儲 介質 | ||
本公開涉及一種圖像識別方法、裝置、電子設備及存儲介質,通過獲取目標圖像,利用預先訓練完成的圖像分割模型得到目標檢測框以及與目標檢測框對應的圖像分割結果圖,根據目標檢測框和圖像分割結果圖,對目標圖像進行裁剪,得到與目標對象對應的目標區域,利用光學字符識別算法確定目標區域中目標對象的內容,得到識別結果,將目標檢測算法和圖像分割算法相結合,能夠準確的對目標圖像進行裁剪,得到單個目標區域,有效的減少其他文本信息的干擾,從而對目標區域進行精準的識別,提高圖像識別的準確率。
技術領域
本公開涉及人工智能技術領域,尤其涉及一種圖像識別方法、裝置、電子設備及存儲介質。
背景技術
現如今,隨著人工智能的快速發展,通過對包含題目信息的圖像進行題目搜索,從而得到專業的解答,已成為一種流行的學習方式。
目前基于圖像進行題目的搜索的方法,主要為基于目標檢測的方法,利用矩形框將圖像中包含的每道題目進行框選,根據框選結果對圖像中包含的多道題目進行裁剪,得到包含單個題目信息的題目區域,根據裁剪出的題目區域進行字符識別,根據識別內容進行搜索,獲得精準的搜索結果。
但是,獲取的圖像包含的題目內容往往存在著傾斜和扭曲的現象,通過現有技術得到的題目區域難以將每道題目的邊界準確的區分開,尤其在圖像中包含多個題目區域時,題目框選的區域容易出現交疊的現象,根據框選結果對圖像進行裁剪就會包含其他題目信息,從而導致單個題目識別結果的前、后或者中間出現干擾文本,無法得到準確的識別結果,搜索的準確率比較低。
發明內容
為了解決上述技術問題或者至少部分地解決上述技術問題,本公開提供了一種圖像識別方法、裝置、電子設備及存儲介質。
第一方面,本公開實施例提供了一種圖像識別方法,包括:
獲取目標圖像,所述目標圖像中包含一個或多個目標對象;
根據所述目標圖像,利用預先訓練完成的圖像分割模型得到目標檢測框以及與所述目標檢測框對應的圖像分割結果圖;
根據所述目標檢測框和所述圖像分割結果圖,對所述目標圖像進行裁剪,得到與所述目標對象對應的目標區域;
利用光學字符識別算法確定所述目標區域中所述目標對象的內容,得到識別結果。
可選地,所述根據所述目標檢測框和所述圖像分割結果圖,對所述目標圖像進行裁剪,得到與所述目標對象對應的目標區域,包括:
根據所述目標檢測框對所述目標圖像進行裁剪,得到第一目標圖像;
根據所述圖像分割結果圖,確定所述圖像分割結果圖中分割出來的所述目標對象的最大連通區域;
根據所述最大連通區域的輪廓的像素點,得到所述輪廓的最小傾斜矩陣;
根據所述最小傾斜矩陣的傾斜角度將所述第一目標圖像轉正;
根據所述最小傾斜矩陣的寬和高對所述轉正后的第一目標圖像進行裁剪,得到與所述目標對象對應的目標區域。
可選地,在所述根據所述目標圖像,利用預先訓練完成的圖像分割模型得到與所述目標對象對應的目標檢測框以及與所述目標檢測框對應的圖像分割結果圖之前,還包括:
將所述目標圖像輸入到預先訓練完成的角度分類模型中,得到所述目標圖像的角度分類結果,根據所述角度分類結果將所述目標圖像進行旋轉;
根據所述旋轉后的目標圖像,利用預先訓練完成的圖像分割模型得到目標檢測框以及與所述目標檢測框對應的圖像分割結果圖。
可選地,所述圖像分割模型包括目標檢測層和圖像分割層,所述目標檢測層用于對所述目標圖像進行特征提取和目標檢測,得到目標特征信息和目標檢測框,所述圖像分割層用于根據所述目標特征信息以及所述目標檢測框,得到所述圖像分割結果圖。
可選地,所述圖像分割層用于根據所述目標特征信息以及所述目標檢測框,得到所述圖像分割結果圖,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京世紀好未來教育科技有限公司,未經北京世紀好未來教育科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110359351.1/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





