[發明專利]一種提取含有二維碼的營業執照信息的方法及裝置在審
| 申請號: | 201910053523.5 | 申請日: | 2019-01-21 |
| 公開(公告)號: | CN109815765A | 公開(公告)日: | 2019-05-28 |
| 發明(設計)人: | 俞菲;潘迪;張旭帆;曹釗銘;周宇;徐琴珍;楊綠溪 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06K7/14 | 分類號: | G06K7/14;G06N3/04 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 211102 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 二維碼 統一資源定位符 預處理 抓取 企業信用信息 網頁頁面信息 樣本處理模塊 二維碼識別 二維碼圖像 圖像 辦公效率 定位模塊 定位模型 基本信息 目標檢測 圖片背景 網絡訓練 網頁信息 準確度 圖像集 準確率 網站 掃描 檢測 學習 | ||
本發明公開了一種提取含有二維碼的營業執照信息的方法及裝置。其中,方法包括:對獲取的含有二維碼的營業執照圖像進行預處理,并基于深度學習的目標檢測網絡訓練預處理后的圖像集,獲得二維碼定位模型;對待檢測含二維碼的營業執照圖像進行二維碼定位;獲得并掃描二維碼圖像,提取所述二維碼包含的企業信用信息網站統一資源定位符;根據所述統一資源定位符對應的網頁頁面信息,抓取所述營業執照的基本信息。裝置包括樣本處理模塊、二維碼定位模塊、二維碼識別模塊及網頁信息抓取模塊。本發明提高了二維碼定位的準確度,克服了圖片背景復雜導致二維碼定位不準確的問題,實現100%準確率提取營業執照信息,提高了辦公效率。
技術領域
本發明涉及一種二維碼信息提取方法及裝置,屬于深度學習、計算機視覺領域,尤其涉及一種提取含有二維碼的營業執照信息的方法及裝置。
背景技術
營業執照是工商行政管理機關發給工商企業、個體經營者的準許從事某項生產經營活動的憑證。為防止不法商鋪偽造營業執照或在營業執照有效期到期之后不及時申請新的營業執照,國家公務人員需要定期檢查備案工商企業、個體經營者的營業執照信息,包括統一社會信用代碼,注冊號,名稱,類型,經營者,組成形式,注冊日期,經營場所,經營范圍,登記狀態等。
傳統營業執照的信息采集都是通過移動終端設備拍攝營業執照圖像,再由專人對這些圖像上的營業執照信息進行人工核實、備案,費時費力。
光學字符識別(Optical Character Recognition,OCR)技術也被用來提取營業執照圖片上的文字信息。然而,該技術所試用的對象是背景單一、字體固定的掃描文本圖片,而營業執照圖片的獲取途徑一般都是由相機拍攝,光照,角度以及營業執照本身的防偽花紋都會降低字符識別的準確率。
從2014年開始,工商行政管理局頒發了含有防偽二維碼的新版營業執照。掃描該二維碼即可進入國家企業信用信息公示系統,上面就顯示了該營業執照的詳細信息,包括注冊號,名稱,類型,注冊日期,核準日期等等。市民可以通過掃描該二維碼得到該商戶的具體信息以判斷該商戶的經營是否合法,而國家公務人員則可以通過掃描二維碼得到營業執照信息以定期更新備案。
普通的二維碼解碼設備都要求二維碼占輸入圖片面積的80%以上,且二維碼要足夠清晰才能夠確保二維碼能被識別解碼。但是,商戶的營業執照往往掛在墻上或者放置在展示柜中,近距離的掃描會造成極大的不方便。一般來說,二維碼都打印在營業執照的左下角并且只占了營業執照的很小一部分面積,如果將移動終端拍攝的營業執照圖像直接輸入二維碼解碼設備往往會導致二維碼解碼失敗。所以將移動終端拍攝的營業執照圖像上的二維碼準確的定位并截取出來,這對后續二維碼識別解碼至關重要。
一方面,傳統的二維碼定位方式是基于連通域的定位,即通過將輸入圖片灰度化,二值化,閉運算后,將連通域面積最大的部分截取出來。這種二維碼定位方法對于圖片背景、光照非常敏感。另一方面,營業執照上的國徽或密集的文字在閉運算后也能生成大面積的連通域,這就會導致最后定位的結果不是二維碼,使定位精度降低。人們更希望掃描之后能看到清晰明了的實用文字信息,國家公務人員也更希望掃描之后可以得到可編輯的文字信息,這樣更新備案商戶信息的時候會更加省時省力。
發明內容
發明目的:本發明提供一種提取營業執照信息的方法,通過基于深度學習的目標檢測網絡對移動終端拍攝的營業執照圖象上的二維碼進行定位、截取、解碼,提高信息提取的準確度和效率。
本發明的另一目的是提供一種基于上述方法的裝置。
技術方案:本發明所述的一種提取含有二維碼的營業執照信息的方法,包括步驟:
(1.1)獲取預處理后含有二維碼的營業執照圖像作為樣本,通過圖片預處理擴充樣本數量;
進一步地,所述圖片預處理包括:對批量獲取的營業執照圖像分別進行鏡像翻轉,旋轉,添加高斯噪聲;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910053523.5/2.html,轉載請聲明來源鉆瓜專利網。





