[發明專利]一種文本圖像傾斜角度的檢測方法及裝置有效
| 申請號: | 202011095925.0 | 申請日: | 2020-10-14 |
| 公開(公告)號: | CN112287927B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 郭從洲;李可;朱奕坤;童曉沖;李賀;魏鑫;王習文;張錦添;雷毅 | 申請(專利權)人: | 中國人民解放軍戰略支援部隊信息工程大學 |
| 主分類號: | G06V20/62 | 分類號: | G06V20/62;G06V10/24;G06V10/764 |
| 代理公司: | 北京國昊天誠知識產權代理有限公司 11315 | 代理人: | 張倩;朱文杰 |
| 地址: | 450001 河*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 圖像 傾斜 角度 檢測 方法 裝置 | ||
1.一種文本圖像傾斜角度的檢測方法,包括:
獲取待檢測的目標文本圖像信息;
基于所述目標文本圖像信息的傾斜角度用途標注信息,在預先訓練好的深度神經網絡模型集合中選擇目標神經網絡模型;其中,所述深度神經網絡模型集合包括:一階段二分類網絡模型和多階段多分類網絡模型;
利用所述目標神經網絡模型,對所述目標文本圖像信息進行圖像傾斜角度識別處理,得到所述目標文本圖像信息的圖像傾斜角度數據;其中,所述圖像傾斜角度數據是基于對所述目標文本圖像信息執行至少一次傾斜角度類別識別所確定的;
其中,所述多階段多分類網絡模型是基于預設樹狀網絡結構所構建的;
所述預設樹狀網絡結構包括:多個傾斜角度識別階段,每個傾斜角度識別階段包括:至少一個傾斜角度識別分支;每個所述傾斜角度識別分支對應兩個傾斜角度類別或多個傾斜角度類別;
下一傾斜角度識別分支對應的傾斜角度類別包括:將上一傾斜角度識別分支對應的傾斜角度類別按照預設角度間隔劃分得到的至少兩個傾斜角度類別;
每個所述傾斜角度識別分支對應于一個分類神經網絡,所述分類神經網絡包括二分類神經網絡、或者多分類神經網絡。
2.根據權利要求1所述的方法,其中,若所述目標神經網絡模型為多階段多分類網絡模型;
所述利用所述目標神經網絡模型,對所述目標文本圖像信息進行圖像傾斜角度識別處理,得到所述目標文本圖像信息的圖像傾斜角度數據,包括:
將所述目標文本圖像信息輸入至所述目標神經網絡模型中的首個傾斜角度識別階段對應的分類神經網絡,得到第一傾斜角度類別;
將所述目標文本圖像信息輸入至下一傾斜角度識別階段中的目標分類神經網絡,得到第二傾斜角度類別;其中,所述目標分類神經網絡為與針對上一傾斜角度識別階段所確定出的傾斜角度類別下的傾斜角度識別分支對應的分類神經網絡;
若所述第二傾斜角度類別不為任一最小傾斜角度類別,則繼續將所述目標文本圖像信息輸入至下一傾斜角度識別階段中的目標分類神經網絡;
若所述第二傾斜角度類別為任一最小傾斜角度類別,則將所述第二傾斜角度類別確定為所述目標文本圖像信息的圖像傾斜角度數據。
3.根據權利要求2所述的方法,其中,所述分類神經網絡包括:圖像輸入層、圖像預處理網絡層、多個多層網絡單元、全局平均池化層、邏輯回歸網絡層、分類結果輸出層;每個所述多層網絡單元包括:批量標準化處理層、卷積層、激活層、最大池化層中至少一項;
所述將所述目標文本圖像信息輸入至下一傾斜角度識別階段中的目標分類神經網絡,得到第二傾斜角度類別,包括:
將所述目標文本圖像信息輸入至所述圖像輸入層,得到所述目標文本圖像信息對應的第一圖像矩陣數據;
將所述第一圖像矩陣數據輸入至所述圖像預處理網絡層,對所述第一圖像矩陣數據進行歸一化處理,得到第二圖像矩陣數據;
將所述第二圖像矩陣數據依次輸入至多個所述多層網絡單元,對所述第二圖像矩陣數據進行圖像特征提取,得到綜合圖像矩陣數據;
將所述綜合圖像矩陣數據輸入至所述全局平均池化層,對所述綜合圖像矩陣數據進行平均池化處理,得到第一圖像特征向量;
將所述第一圖像特征向量輸入至所述邏輯回歸網絡層,對所述第一圖像特征向量進行邏輯回歸處理,得到第二圖像特征向量;
將所述第二圖像特征向量輸入至所述分類結果輸出層,得到第二傾斜角度類別。
4.根據權利要求1所述的方法,其中,所述基于所述目標文本圖像信息的傾斜角度用途標注信息,在預先訓練好的深度神經網絡模型集合中選擇目標神經網絡模型,包括:
基于所述目標文本圖像信息的傾斜角度用途標注信息,確定所述目標文本圖像信息對應的傾斜角度精度要求等級;
若所述傾斜角度精度要求等級小于預設閾值等級,則在預先訓練好的深度神經網絡模型集合中,將所述一階段二分類網絡模型確定為目標神經網絡模型;
若所述傾斜角度精度要求等級大于或等于預設閾值等級,則在預先訓練好的深度神經網絡模型集合中,將所述多階段多分類網絡模型確定為目標神經網絡模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍戰略支援部隊信息工程大學,未經中國人民解放軍戰略支援部隊信息工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011095925.0/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





