[發(fā)明專利]一種發(fā)票圖像定位方法在審
| 申請?zhí)枺?/td> | 201910246868.2 | 申請日: | 2019-03-29 |
| 公開(公告)號: | CN109948617A | 公開(公告)日: | 2019-06-28 |
| 發(fā)明(設(shè)計(jì))人: | 桂冠;孟洋;孫穎異;李懋陽;邵蕾;熊健;楊潔 | 申請(專利權(quán))人: | 南京郵電大學(xué) |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/46;G06K9/62 |
| 代理公司: | 南京縱橫知識產(chǎn)權(quán)代理有限公司 32224 | 代理人: | 范青青;董建林 |
| 地址: | 210003 江蘇*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 發(fā)票 圖像定位 圖像 圖像處理技術(shù) 計(jì)算機(jī)視覺 霍夫變換 傾斜校正 圖像加載 準(zhǔn)確定位 移動端 權(quán)重 算法 拍攝 學(xué)習(xí) | ||
1.一種發(fā)票圖像定位方法,其特征在于,包括如下步驟:
將待定位發(fā)票圖像加載至已訓(xùn)練好的深度學(xué)習(xí)模型中;
根據(jù)霍夫變換算法對待定位發(fā)票圖像進(jìn)行傾斜校正;
根據(jù)訓(xùn)練生成的最佳權(quán)重值對待定位發(fā)票圖像進(jìn)行定位。
2.根據(jù)權(quán)利要求1所述的發(fā)票圖像定位方法,其特征在于,最佳權(quán)重值的訓(xùn)練生成包括如下步驟:
采集發(fā)票圖像構(gòu)建數(shù)據(jù)集;
對數(shù)據(jù)集的發(fā)票圖像打標(biāo)簽,所述打標(biāo)簽的發(fā)票欄目包括購買方、銷售方、貨物詳情和價稅合計(jì);
將數(shù)據(jù)集的發(fā)票圖像和打標(biāo)簽生成的文件輸入到特征提取網(wǎng)絡(luò),訓(xùn)練生成最佳權(quán)重值。
3.根據(jù)權(quán)利要求2所述的發(fā)票圖像定位方法,其特征在于,對發(fā)票圖像打標(biāo)簽的工具為labelImg工具。
4.根據(jù)權(quán)利要求1所述的發(fā)票圖像定位方法,其特征在于,霍夫變換算法通過python生成,包括如下步驟:
調(diào)用OpenCV中的HoughTransform()函數(shù),用于提取待定位發(fā)票圖像;
調(diào)用HoughLines()函數(shù),用于提取待定位發(fā)票圖像中的直線。
5.根據(jù)權(quán)利要求1所述的發(fā)票圖像定位方法,其特征在于,霍夫變換算法的公式如下:
y=mx+b
式中,(x,y)為發(fā)票圖像中直線任一點(diǎn)在直角坐標(biāo)系中的坐標(biāo)參數(shù),m為發(fā)票圖像中直線的斜率,b為發(fā)票圖像中直線的截距。
6.根據(jù)權(quán)利要求1所述的發(fā)票圖像定位方法,其特征在于,霍夫變換算法提取直線的Hesse normal form公式如下:
式中,(x',y')為發(fā)票圖像中被提取直線l上任一點(diǎn)在極坐標(biāo)系中的坐標(biāo)參數(shù),rl為極坐標(biāo)系原點(diǎn)到發(fā)票圖像上被提取直線l的距離,θl為極坐標(biāo)系X'軸與發(fā)票圖像上被提取直線l的垂直線的夾角,cos(θl)為對θl取余弦值,sin(θl)為對θl取正弦值。
7.根據(jù)權(quán)利要求2所述的發(fā)票圖像定位方法,其特征在于,所述深度學(xué)習(xí)模型為YOLOv3深度學(xué)習(xí)模型,所述特征提取網(wǎng)絡(luò)為YOLOv3深度學(xué)習(xí)模型中的Darknet53特征提取網(wǎng)絡(luò)。
8.根據(jù)權(quán)利要求7所述的發(fā)票圖像定位方法,其特征在于,所述傾斜校正包括如下步驟:
將霍夫變換算法嵌入到Y(jié)OLOv3深度學(xué)習(xí)模型中的測試腳本文件中;
運(yùn)行測試腳本文件對待定位發(fā)票圖像進(jìn)行傾斜校正。
9.根據(jù)權(quán)利要求7所述的發(fā)票圖像定位方法,其特征在于,所述對待定位發(fā)票圖像進(jìn)行定位包括如下步驟:
將最佳權(quán)重值加載到Y(jié)OLOv3深度學(xué)習(xí)模型中的測試腳本文件中;
運(yùn)行測試腳本文件對待定位發(fā)票圖像進(jìn)行定位。
10.根據(jù)權(quán)利要求1至9任一項(xiàng)所述的發(fā)票圖像定位方法,其特征在于,所述發(fā)票包括中國各省增值稅普通發(fā)票,所述發(fā)票圖像包括基于移動端拍攝的發(fā)票圖像。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京郵電大學(xué),未經(jīng)南京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910246868.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





