[發明專利]一種圖像識別的方法及裝置有效
| 申請號: | 201711080946.3 | 申請日: | 2017-11-06 |
| 公開(公告)號: | CN109753981B | 公開(公告)日: | 2020-12-22 |
| 發明(設計)人: | 葛凱麟;宋卿 | 申請(專利權)人: | 彼樂智慧科技(北京)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46;G06K9/20 |
| 代理公司: | 北京勁創知識產權代理事務所(普通合伙) 11589 | 代理人: | 張鐵蘭 |
| 地址: | 100191 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖像 識別 方法 裝置 | ||
1.一種圖像識別的方法,其特征在于,所述方法包括:
圖像識別裝置通過攝像頭采集圖像,所述圖像包括多邊形邊框及位于所述邊框內的內容區;該邊框呈封閉式且具備一定寬度,邊框顏色與內容區的底色區別,且邊框與內容區間隔一定的寬度;
所述圖像識別裝置通過幾何形態分析識別出所述圖像中的邊框區域;
所述圖像識別裝置確定所述邊框及所述內容區的位置信息,并通過機器學習法對所述邊框區域內的內容區進行識別;
所述圖像識別裝置輸出所述內容區中識別出的內容信息;
其中,所述圖像識別裝置通過幾何形態分析識別出所述圖像中的邊框區域,包括:
對所述圖像進行二值化處理,并對所述二值化處理后的圖像的連通區域進行掃描;
對所述掃描后的圖像進行輪廓篩選,保留所述多邊形邊框的輪廓,并獲取所述多邊形邊框的幾何參數;
所述對所述掃描后的圖像進行輪廓篩選,保留所述多邊形邊框的輪廓,并獲取所述多邊形邊框的幾何參數,包括:
利用局部平均算法對輪廓線進行一次平滑,并使用近鄰差分法計算輪廓線上每一點的切向量;
利用分級聚類法對所述輪廓線中所有切向量坐標進行分析,獲取分析后的顯性聚類數據;
將所述顯性聚類對應的輪廓點提取到對應的數據集合中,該數據集合為所述多邊形邊框的擬合數據;
對所述數據集合中的數據進行直線擬合,并獲取所述多邊形邊框的幾何參數。
2.根據權利要求1所述的方法,其特征在于,所述圖像還包括方向標識,則所述圖像識別裝置通過幾何形態分析識別出所述圖像中的邊框區域之后,所述方法還包括:
所述圖像識別裝置檢測到所述方向標識,根據所述方向標識旋轉所述圖像中的邊框及所述邊框內的內容區,以使所述旋轉后的邊框及邊框內的內容區處于水平位置。
3.根據權利要求1所述的方法,其特征在于,在獲取所述多邊形邊框的幾何參數之后,所述方法還包括:
當檢測到所述圖像發生形變時,基于所述直線擬合后的邊框信息對所述圖像進行鄰近區域圖像矯正。
4.根據權利要求1-3任一項所述的方法,其特征在于,所述通過機器學習法對所述邊框區域內的內容區進行識別,包括:
對預先設置的樣本數據庫中樣本提取方向梯度直方圖特征,利用深度神經網絡進行分類器分類訓練;
利用所述分類器對所述內容區進行判別,并將所述判別結果與所述樣本進行比對,根據比對結果識別所述內容區。
5.一種圖像識別裝置,其特征在于,所述裝置包括處理器、存儲器、數據總線、輸入接口及輸出接口,所述處理器、存儲器、輸入接口與輸出接口分別連接于所述數據總線,并通過所述數據總線實現數據交互,其中,所述輸入接口連接一個或多個攝像頭,用于接收攝像頭采集的圖像,所述圖像包括多邊形邊框及位于所述邊框內的內容區;該邊框呈封閉式且具備一定寬度,邊框顏色與內容區的底色區別,且邊框與內容區間隔一定的寬度;所述處理器用于通過幾何形態分析識別出所述圖像中的邊框區域,確定所述邊框及所述邊框內內容區的位置信息,并對所述邊框區域內的內容區進行識別;所述輸出接口用于輸出所述內容區中識別出的內容信息;
其中,所述處理器用于通過幾何形態分析識別出所述圖像中的邊框區域,包括:
所述處理器用于對所述圖像進行二值化處理,并對所述二值化處理后的圖像的連通區域進行掃描;
對所述掃描后的圖像進行輪廓篩選,保留所述多邊形邊框的輪廓,并獲取所述多邊形邊框的幾何參數;
其中,所述處理器用于對所述掃描后的圖像進行輪廓篩選,保留所述多邊形邊框的輪廓,并獲取所述多邊形邊框的幾何參數,包括:
利用局部平均算法對輪廓線進行一次平滑,并使用近鄰差分法計算輪廓線上每一點的切向量;
利用分級聚類法對所述輪廓線中所有切向量坐標進行分析,獲取分析后的顯性聚類數據;
將所述顯性聚類對應的輪廓點提取到對應的數據集合中,該數據集合為所述多邊形邊框的擬合數據;
對所述數據集合中的數據進行直線擬合,并獲取所述多邊形邊框的幾何參數。
6.根據權利要求5所述的裝置,其特征在于,所述圖像還包括方向標識,則所述處理器還用于:
檢測到所述方向標識,根據所述方向標識旋轉所述圖像中的邊框及所述邊框內的內容區,以使所述旋轉后的邊框及邊框內的內容區處于水平位置。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于彼樂智慧科技(北京)有限公司,未經彼樂智慧科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711080946.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于檢測的方法和裝置
- 下一篇:障礙點檢測方法、裝置和計算機可讀存儲介質
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





