[發(fā)明專利]一種發(fā)票目標(biāo)區(qū)域的定位方法、裝置、設(shè)備及介質(zhì)在審
| 申請?zhí)枺?/td> | 202010010700.4 | 申請日: | 2020-01-06 |
| 公開(公告)號: | CN111241966A | 公開(公告)日: | 2020-06-05 |
| 發(fā)明(設(shè)計)人: | 黎賢釗;張學(xué)習(xí);彭健彬 | 申請(專利權(quán))人: | 廣東工業(yè)大學(xué) |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/20;G06N3/04;G06T3/40;G06T5/00;G06T7/90;G06N3/08 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 黃忠 |
| 地址: | 510060 廣東省*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 發(fā)票 目標(biāo) 區(qū)域 定位 方法 裝置 設(shè)備 介質(zhì) | ||
本申請公開了一種發(fā)票目標(biāo)區(qū)域的定位方法、裝置、設(shè)備及介質(zhì),其方法包括:獲取待測圖像;將待測圖像輸入到訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)中,對待測圖像中的目標(biāo)區(qū)域進行檢測;若存在目標(biāo)區(qū)域,則對目標(biāo)區(qū)域進行定位;對定位的目標(biāo)區(qū)域進行分類,并得到分類后的目標(biāo)區(qū)域的圖像坐標(biāo)。本申請通過采用深度學(xué)習(xí)網(wǎng)絡(luò)代替?zhèn)鹘y(tǒng)的圖像匹配方法,能比傳統(tǒng)算法更好在檢測速度與檢測精度之間作更好的平衡,且相對于傳統(tǒng)圖像匹配算法具有更好的魯棒性。
技術(shù)領(lǐng)域
本申請涉及目標(biāo)檢測技術(shù)領(lǐng)域,尤其涉及一種發(fā)票目標(biāo)區(qū)域的定位方法、裝置、設(shè)備及介質(zhì)。
背景技術(shù)
發(fā)票在社會經(jīng)濟活動中具有極其重要的意義和作用。由于發(fā)票上具有很多重要的信息需要我們錄入計算機當(dāng)中,而發(fā)票信息的錄入對于我們來說是一件繁瑣而重復(fù)性高的工作。對于重復(fù)性高的工作,我們可以用自動化的算法來替代,以提高工作效率。但是發(fā)票的錄入又不是純碎的重復(fù)性工作,需要我們?nèi)斯とプR別發(fā)票的信息才能進行發(fā)票錄入。因此,我們可以利用計算機視覺去代替人工的識別。計算機視覺去代替人工的識別,需要兩個步驟,首先是對輸入的圖像進行目標(biāo)檢測,通過目標(biāo)檢測出需要的識別出來的信息的位置,然后再進行識別。
現(xiàn)有的的文本定位方法中,通常使用連通域分析和滑動窗口分類法進行圖像文本定位。文本特征主要有文本的顏色、邊界、筆畫和紋理等特征。連通域分析是一種類似于圖形的算法,在實現(xiàn)過程中,使用結(jié)構(gòu)模式識別方法確定文本區(qū)域。使用統(tǒng)計學(xué)模型有利于提高效率。滑動窗口分類方法通過條件隨機場、形態(tài)學(xué)操作或者圖形方法可以進一步地將字符分類響應(yīng)為正的候選文本區(qū)域正組成文本區(qū)域,該方法簡單,適應(yīng)性廣。
使用滑動窗口進行目標(biāo)區(qū)域的檢測,是一種很常見檢測算法。它主要分為兩個步驟:提取特征和特征匹配。提取特征常用的算子有Sobel、Canny、Hog、SIFT等。特征提取就是通過特征提取算子提取原圖像的一些特征,然后使用滑動檢測窗口以一定的步長對待檢測圖像進行特征匹配判定。設(shè)定一個匹配閾值,若超過匹配閾值,則輸出目標(biāo)區(qū)域的坐標(biāo)。使用滑動窗口匹配特征的算法在一定程度上能比較有效地檢測出目標(biāo)區(qū)域。但是滑動窗口在遍歷時候需要進行大量的計算,這導(dǎo)致了在檢測環(huán)節(jié)可能對硬件性能有很高的要求才能保證系統(tǒng)的檢測環(huán)節(jié)不需要大量的計算時間。因此,該算法可能會在提高精度的同時,而會產(chǎn)生高延遲。
發(fā)明內(nèi)容
本申請實施例提供了一種發(fā)票目標(biāo)區(qū)域的定位方法、裝置、設(shè)備及介質(zhì),使得目標(biāo)檢測能更好地提升檢測精度的同時而又不會產(chǎn)生過高的系統(tǒng)延遲。
有鑒于此,本申請第一方面提供了一種發(fā)票目標(biāo)區(qū)域的定位方法,所述方法包括:
獲取待測圖像;
將所述待測圖像輸入到訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)中,對所述待測圖像中的目標(biāo)區(qū)域進行檢測;
若存在所述目標(biāo)區(qū)域,則對所述目標(biāo)區(qū)域進行定位;
對所述定位的目標(biāo)區(qū)域進行分類,并得到分類后的目標(biāo)區(qū)域的圖像坐標(biāo)。
可選的,在將所述待測圖像輸入到訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)中,對所述待測圖像中的目標(biāo)區(qū)域進行檢測之前,還包括:
將所述待測圖像進行圖像尺度歸一化處理,使得所述待測圖像輸出為滿足神經(jīng)網(wǎng)絡(luò)輸入尺寸的圖像。
可選的,所述將所述待測圖像進行圖像尺度歸一化處理,使得所述待測圖像輸出為滿足神經(jīng)網(wǎng)絡(luò)輸入尺寸的圖像具體為:
采用雙線性插值法對所述待測圖像進行圖像尺度歸一化處理,使得所述待測圖像輸出為滿足神經(jīng)網(wǎng)絡(luò)輸入尺寸的圖像。
可選的,所述將所述待測圖像輸入到神經(jīng)網(wǎng)絡(luò)中對圖像中的目標(biāo)區(qū)域進行檢測具體為:
將所述待測圖像輸入到Darknt52網(wǎng)絡(luò)中對圖像中的目標(biāo)區(qū)域進行檢測。
可選的,所述對目標(biāo)區(qū)域進行定位具體為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東工業(yè)大學(xué),未經(jīng)廣東工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010010700.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:基于深度強化學(xué)習(xí)的能源互聯(lián)網(wǎng)中虛擬電廠經(jīng)濟調(diào)度方法
- 下一篇:基于神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的列車車載設(shè)備故障預(yù)測方法及裝置
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 目標(biāo)檢測裝置、學(xué)習(xí)裝置、目標(biāo)檢測系統(tǒng)及目標(biāo)檢測方法
- 目標(biāo)監(jiān)測方法、目標(biāo)監(jiān)測裝置以及目標(biāo)監(jiān)測程序
- 目標(biāo)監(jiān)控系統(tǒng)及目標(biāo)監(jiān)控方法
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤設(shè)備
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤裝置
- 目標(biāo)檢測方法和目標(biāo)檢測裝置
- 目標(biāo)跟蹤方法、目標(biāo)跟蹤裝置、目標(biāo)跟蹤設(shè)備
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)跟蹤系統(tǒng)及目標(biāo)跟蹤方法





