[發明專利]證件識別方法和裝置、電子設備、計算機可讀存儲介質在審
申請號: | 201910362419.4 | 申請日: | 2019-04-30 |
公開(公告)號: | CN110321895A | 公開(公告)日: | 2019-10-11 |
發明(設計)人: | 鄭迪昕;劉學博 | 申請(專利權)人: | 北京市商湯科技開發有限公司 |
主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/32 |
代理公司: | 北京思源智匯知識產權代理有限公司 11657 | 代理人: | 王曉多 |
地址: | 100084 北京市海淀區中*** | 國省代碼: | 北京;11 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 文本區域 字符類型 關鍵點 證件 計算機可讀存儲介質 方法和裝置 邊界限定 電子設備 文本識別 證件識別 證件圖像 準確率 關鍵點檢測 多行文本 文本位置 文本行 減小 | ||
本公開實施例公開了一種證件識別方法和裝置、電子設備、計算機可讀存儲介質,其中,方法包括:對證件圖像進行關鍵點檢測,獲得所述證件圖像中包括的證件的多個關鍵點的信息,其中,所述多個關鍵點包括所述證件中第一文本區域的至少兩個邊界限定點,所述第一文本區域中包括多個對應于第一字符類型的文本行;基于所述多個關鍵點的信息,確定所述證件的文本識別結果,通過增加第一文本區域的至少兩個邊界限定點,有利于提高對第一文本區域中多行文本的文本位置的識別準確率,減小了其他字符類型對第一字符類型的文本識別帶來的影響,提高了對證件中第一字符類型內容的識別準確率。
技術領域
本公開涉及計算機視覺技術,尤其是一種證件識別方法和裝置、電子設備、計算機可讀存儲介質。
背景技術
光學字符識別(Optical Character Recognition,OCR)技術被廣泛應用于各種證件、卡片和票據的識別中。目前的OCR識別技術對于常用字符的識別具有較高的識別精度,然而對于少數民族文字等特殊類型的字符的識別精度還有待提高。
發明內容
本公開實施例提供的一種證件識別技術。
根據本公開實施例的一個方面,提供的一種證件識別方法,包括:對證件圖像進行關鍵點檢測,獲得所述證件圖像中包括的證件的多個關鍵點的信息,其中,所述多個關鍵點包括所述證件中第一文本區域的至少兩個邊界限定點,所述第一文本區域中包括多個對應于第一字符類型的文本行;基于所述多個關鍵點的信息,確定所述證件的文本識別結果。
在一些實施例中,第一文本區域的至少兩個邊界限定點包含第一文本區域的左上角關鍵點和右下角關鍵點。
可選地,在本公開上述任一方法實施例中,所述證件還包括第二文本區域,其中,所述第二文本區域包括至少一個對應于不同于所述第一字符類型的第二字符類型的文本行,且所述第二文本區域與所述第一文本區域的文本內容相同。
可選地,在本公開上述任一方法實施例中,所述第一字符類型為漢字,所述第二字符類型為少數民族文字。
可選地,在本公開上述任一方法實施例中,基于所述多個關鍵點的信息,確定所述證件的文本識別結果,包括:基于所述第一文本區域的至少兩個邊界限定點的信息,對所述第一文本區域包含的多個文本行中每個文本行的初始預測位置進行修正處理,得到所述多個文本行的目標預測位置;基于所述第一文本區域包含的多個文本行中每個文本行的目標預測位置,對所述證件中包含的對應于所述第一字符類型的至少一個文本區域進行識別,獲得所述證件的文本識別結果。
可選地,在本公開上述任一方法實施例中,基于所述多個關鍵點的信息,確定所述證件的文本識別結果,包括:基于所述第一文本區域的至少兩個邊界限定點的信息,對所述第一文本區域包含的多個文本行中每個文本行的初始預測行高進行修正處理,得到所述多個文本行的目標預測行高;基于所述第一文本區域包含的多個文本行中每個文本行的目標預測行高,對所述證件中包含的對應于所述第一字符類型的至少一個文本區域進行識別,獲得所述證件的文本識別結果。
可選地,在本公開上述任一方法實施例中,所述基于所述多個關鍵點的信息,確定所述證件的文本識別結果,包括:
基于所述第一文本區域的至少兩個邊界限定點的信息,確定所述第一文本區域包含的多個文本行中每個文本行的目標預測位置;
基于所述第一文本區域包含的多個文本行中每個文本行的目標預測位置,對所述證件中包含的對應于所述第一字符類型的至少一個文本區域進行識別,獲得所述證件的文本識別結果。
可選地,在本公開上述任一方法實施例中,所述基于所述第一文本區域的至少兩個邊界限定點的信息,確定所述第一文本區域包含的多個文本行中每個文本行的目標預測位置,包括:
基于所述第一文本區域的至少兩個邊界限定點的信息,確定所述第一文本區域包含的多個文本行中每個文本行的初始預測位置;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京市商湯科技開發有限公司,未經北京市商湯科技開發有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910362419.4/2.html,轉載請聲明來源鉆瓜專利網。