[發明專利]一種印章內容識別方法、系統、計算機設備及存儲介質在審
| 申請號: | 202210909323.7 | 申請日: | 2022-07-29 |
| 公開(公告)號: | CN115410204A | 公開(公告)日: | 2022-11-29 |
| 發明(設計)人: | 沈輝 | 申請(專利權)人: | 眾安在線財產保險股份有限公司 |
| 主分類號: | G06V30/14 | 分類號: | G06V30/14 |
| 代理公司: | 北京市萬慧達律師事務所 11111 | 代理人: | 康麗麗 |
| 地址: | 200002 上海市黃*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 印章 內容 識別 方法 系統 計算機 設備 存儲 介質 | ||
本申請公開了一種印章內容識別方法、系統、計算機設備及存儲介質,內容識別技術領域,包括提取印章信息區域中的點,得到邊界點集,提取邊界點集形成區域中的點,得到第一點集,擬合第一點集得到第一圓弧;結合第一圓弧參數篩選邊界點集中第一圓弧以外的點,得到第二點集,擬合第二點集得到第二圓弧;保留第一點集中點的像素,得到第一圖片;根據第二圓弧的參數信息,對第一圖片進行圖像變換,形成正向圖片;對正向圖片進行連通域篩選,并對篩選后的圖像進行文字識別,得到印章內容。本申請在擬合階段,我們分兩次擬合較直接采用PSENet結果擬合更精確。通過簡單的變形轉換,我們能有效的將曲邊文字信息區域轉成水平文字信息區域。
技術領域
本申請涉及內容識別技術領域,具體涉及一種印章內容識別方法、系統、計算機設備及存儲介質。
背景技術
隨著人工智能技術的發展,目前,很多公司已經引入了OCR算法,用機器取代人工,通過自動化的方式解析文檔數據,從而達到節約人力同時提升業務效率的目的。在眾多的OCR技術中,印章的解析是一個難點,一直沒有公開的有效解決方式。一方面,印章本身多以不規則的形態呈現,如圓形印章,橢圓形印章,藝術字體等,不規則文字的檢測和識別要比規則文本的檢測和識別復雜得多。另一方面,由于章生成的不穩定性,這種不穩定性主要表現在蓋章的位置不固定,章的朝向不固定,章的顏色深淺不固定,最終導致對印章內容的信息解析充滿挑戰。
印章種類繁多,在眾多樣式中,常以圓形、橢圓形印章較為常見,所用范圍最廣,常見于證明、證件、發票、企業報表等。雖然,印章提取難度重重,但是它往往又是自動化業務流程中不可或缺的一步。例如在自動化保險理賠場景中,承保方必須要求發票上的醫院名稱和病史材料上的醫院名稱一致,而有些地區發票上的醫院名稱僅能通過解析印章得到,足以見印章解析在整個自動化流程中起到的關鍵作用。因此,亟需一種印章的析取算法,夠有效提取印章信息區域。
發明內容
為了解決上述背景技術中提到的至少一個問題,本申請提供一種印章內容識別方法、系統、計算機設備及存儲介質,在擬合階段,我們分兩次擬合較直接采用PSENet結果擬合更精確。通過簡單的變形轉換,我們能有效的將曲邊文字信息區域轉成水平文字信息區域,從而進一步為精確識別提供了較好的輸入,提升了最后的識別結果準確率。
本申請實施例提供的具體技術方案如下:
第一方面,一種印章內容識別方法,所述方法包括:
提取印章信息區域中的點,得到邊界點集,提取所述邊界點集形成區域中的點,得到第一點集,擬合所述第一點集得到第一圓弧;
結合所述第一圓弧參數篩選所述邊界點集中第一圓弧以外的點,得到第二點集,擬合所述第二點集得到第二圓弧;
保留所述第一點集中點的像素,得到第一圖片;
根據第二圓弧的參數信息,對第一圖片進行圖像變換,形成正向圖片;
對正向圖片進行連通域篩選,并對篩選后的圖像進行文字識別,得到印章內容。
在一個具體的實施例中,所述擬合所述第一點集得到第一圓弧,具體包括:
采用最小二乘法對第一點集內的點進行圓弧擬合,得到圓心為p1,半徑為r1的第一圓弧。
在一個具體的實施例中,結合所述第一圓弧參數篩選所述邊界點集中第一圓弧以外的點,得到第二點集,擬合所述第二點集得到第二圓弧,具體包括:
計算所述邊界點集中所有的點到所述第一圓弧的圓心的距離L1;
判斷L1是否大于r1和預設閾值的和;
若L1大于r1和預設閾值的和,則添加對應的點到第二點集中;否則,則舍棄該點;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于眾安在線財產保險股份有限公司,未經眾安在線財產保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210909323.7/2.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





