[發明專利]智能防漏的資產查重方法、系統、設備及計算機可讀存儲介質在審
| 申請號: | 202111657068.3 | 申請日: | 2021-12-30 |
| 公開(公告)號: | CN114399756A | 公開(公告)日: | 2022-04-26 |
| 發明(設計)人: | 呂永 | 申請(專利權)人: | 上海聚均科技有限公司 |
| 主分類號: | G06V20/62 | 分類號: | G06V20/62;G06V10/28;G06V10/44;G06V30/10 |
| 代理公司: | 上海漢聲知識產權代理有限公司 31236 | 代理人: | 胡晶 |
| 地址: | 200135 上海市浦東新區中國*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 智能 防漏 資產 方法 系統 設備 計算機 可讀 存儲 介質 | ||
本發明提供了一種智能防漏的資產查重方法、系統、設備和計算機可讀存儲介質。通過本申請提出的技術方案,能夠利用光學字符識別結果對識別出來的字符進行坐標位置的確定,并據此獲取光學字符識別結果對應的識別文字分布情況和空白區域分布情況,進而對于基于光學字符識別結果獲取的空白區域在原始圖像的基礎上進行位置分布判斷和像素色彩分布判斷,進而得出上述空白區域中是否存在可能遺漏識別的情況,并對出現可能遺漏識別情況的區域進行二次文字識別以防止遺漏識別和資產遺漏查詢的情況產生,具有可推廣價值。
技術領域
本發明涉及圖像識別技術領域,具體地,公開了一種智能防漏的資產查重方法、系統、設備及計算機可讀存儲介質。
背景技術
近幾年來,應收賬款等動產抵押相關業務在銀行興起。此類資產的特點是一個資產包會有成千上萬筆小資產,單純靠人工去核查資產是否有被重復登記,成本過高,幾乎不具可行性。因此必須借助計算機進行資產查重。大部分的資產登記文件都是圖片,所以計算機首先會對資產登記文件進行光學字符識別,把圖片轉化成文本。業務員會去使用一些關鍵詞去搜索文本,一個資產登記文件文本中如果包含這些關鍵詞,就表示該資產已經被登記了,是重復資產。由于光學字符識別技術的局限性,往往會造成部分圖片文字沒有被識別出來,如果這些文字沒有識別出來,業務員使用關鍵詞搜索就有可能會遺漏一些資產。
在現有技術中,還可以通過光學字符識別引擎識別出來的字符識別率去合成一個文件的識別率,對于識別率低的文件可以挑選出來讓人工進行復核。但由于光學字符識別的字符識別率往往只是針對已經識別出來的字符進行識別率的評分,仍然無法從根源上解決遺漏識別字符的情況。
發明內容
為了解決現有技術中存在的上述問題,本發明提供一種智能防漏的資產查重方法、系統、設備及計算機可讀存儲介質。
在本申請的第一方面提供了一種智能防漏的資產查重方法,用于根據資產登記文件對應的圖像數據進行重復資產查詢,該種資產查重方法包括如下步驟:
獲取資產登記文件對應的原始圖像;
根據原始圖像進行文字識別處理,獲取資產登記文件對應的第一文字識別結果以及第一文字分布區域;
根據原始圖像進行黑白二值化處理,獲取由黑色像素和白色像素組成異色圖像;
根據非第一文字分布區域的分布情況,獲取對應的可能漏識別區域;
根據異色圖像的像素分布情況,于可能漏識別區域中,獲取黑色像素占比值;
在黑色像素占比值處于預設區間的情況下,根據對應的可能漏識別區域進行二次文字識別處理以獲取對應的第二文字識別結果;
重復資產查詢的結果包括第一文字識別結果和第二文字識別結果。
在上述第一方面的一種可能的實現中,在根據原始圖像進行文字識別處理的過程中,還包括:
使用光學字符識別引擎對原始圖像進行字符識別,獲取每個可識別字符于原始圖像中的坐標信息;
根據每個可識別字符對應的坐標信息,確定每個可識別字符于原始圖像中的占位區域;
第一文字識別結果包括每個可識別字符對應的字符含義信息;
第一文字分布區域包括每個可識別字符對應的占位區域。
在上述第一方面的一種可能的實現中,進一步地,非第一文字分布區域包括原始圖像中除每個可識別字符對應的占位區域以外的全部區域。
在上述第一方面的一種可能的實現中,進一步地,在根據原始圖像進行黑白二值化處理的過程中,還包括:
將原始圖像中全部白色像素對應的區域保持不變;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海聚均科技有限公司,未經上海聚均科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111657068.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種可調角度吊籠的安全監測系統及監測方法
- 下一篇:一種轉印膜的轉印方法





