[發(fā)明專利]圖像信息提取方法、裝置、電子設(shè)備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202011502197.0 | 申請日: | 2020-12-18 |
| 公開(公告)號: | CN112560855B | 公開(公告)日: | 2022-10-14 |
| 發(fā)明(設(shè)計)人: | 張舒婷;賴眾程;李驍;姜篤一;李林毅;馬超;王小紅 | 申請(專利權(quán))人: | 平安銀行股份有限公司 |
| 主分類號: | G06V10/25 | 分類號: | G06V10/25;G06V20/62;G06V10/44;G06V10/30;G06V10/774;G06V10/764;G06V30/146;G06V30/18;G06V30/164;G06V30/19;G06F16/35;G06F40/216;G06F40/295 |
| 代理公司: | 深圳市沃德知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖像 信息 提取 方法 裝置 電子設(shè)備 存儲 介質(zhì) | ||
本發(fā)明涉及數(shù)據(jù)處理技術(shù),揭露一種圖像信息提取方法,包括:對原始圖像進(jìn)行圖像主體和文本提取,得到文字塊集合并根據(jù)文字塊集合的排列順序,生成原始順序鏈;根據(jù)文字塊集合中每個文字塊與其右相鄰文字塊得到第一概率值,根據(jù)文字塊集合中每個文字塊與其下相鄰文字塊得到第二概率值;根據(jù)所述第一及第二概率值,調(diào)整原始順序鏈得到標(biāo)準(zhǔn)順序鏈,并根據(jù)所述標(biāo)準(zhǔn)順序鏈進(jìn)行文字塊拼接,得到字符串并通過對所述字符串進(jìn)行字段抽取,得到目標(biāo)信息集。本發(fā)明還涉及區(qū)塊鏈技術(shù),所述原始圖像等可以存儲在區(qū)塊鏈節(jié)點(diǎn)中。本發(fā)明還揭露一種圖像信息提取裝置、電子設(shè)備及存儲介質(zhì)。本發(fā)明可以解決圖像信息抽取效率低、識別結(jié)果不準(zhǔn)確的問題。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種圖像信息提取方法、裝置、電子設(shè)備及計算機(jī)可讀存儲介質(zhì)。
背景技術(shù)
目前,圖像已經(jīng)成為我們生活中信息的主要載體,為了對圖像中的信息進(jìn)行分析,首先需要對圖像中的信息進(jìn)行識別。例如,在銀行私募基金業(yè)務(wù)場景下,合格的投資者需具備相應(yīng)的風(fēng)險識別能力和風(fēng)險承受能力,所以對投資者的個人資產(chǎn)有一定要求。因此,投資者資產(chǎn)認(rèn)證需要投資者上傳個人的資產(chǎn)圖像,例如銀行/理財平臺截圖、存款證明、收入證明等多張多種類型的資產(chǎn)證明圖像。銀行后端審核員需要在投資者上傳資產(chǎn)證明圖像后第一時間內(nèi)完成所述資產(chǎn)圖像的審核。
傳統(tǒng)的資產(chǎn)圖像的審核是基于截圖模板抽取的方法,利用現(xiàn)有的截圖模板與待審核的資產(chǎn)圖像進(jìn)行比較,抽取出圖像中的信息。但每種圖像的界面不盡相同,模板不通用且無法窮舉,不同的圖像界面格式差別大,針對每個圖像界面都需要人工設(shè)置特定的模板,需要耗費(fèi)大量的審核人力,不僅效率低,識別結(jié)果也不準(zhǔn)確。
發(fā)明內(nèi)容
本發(fā)明提供一種圖像信息提取方法、裝置、電子設(shè)備及計算機(jī)可讀存儲介質(zhì),其主要目的在于解決圖像信息抽取效率低、識別結(jié)果不準(zhǔn)確的問題。
為實(shí)現(xiàn)上述目的,本發(fā)明提供的一種圖像信息提取方法,包括:
獲取原始圖像,對所述原始圖像進(jìn)行圖像主體提取處理,得到標(biāo)準(zhǔn)圖像;
利用預(yù)設(shè)的文本提取算法對所述標(biāo)準(zhǔn)圖像進(jìn)行文本提取,得到文字塊集合;
根據(jù)所述文字塊集合在所述標(biāo)準(zhǔn)圖像中的排列順序,生成所述文字塊集合的原始順序鏈,查找所述原始順序鏈中每一個文字塊的相鄰文字塊,其中,所述相鄰文字塊包括下相鄰文字塊和右相鄰文字塊;
通過遍歷操作從所述文字塊集合中依次選擇其中一個文字塊,將選擇的所述文字塊與對應(yīng)的右相鄰文字塊輸入至預(yù)訓(xùn)練的順序重排模型,得到第一概率值,以及將選擇的所述文字塊與對應(yīng)的下相鄰文字塊再次輸入至所述順序重排模型中,得到第二概率值;
在所述第一概率值大于所述第二概率值,維持所述原始順序鏈,若所述第一概率值小于或者等于所述第二概率值,將所述下相鄰文字塊插入至選擇的所述文字塊和所述右相鄰文字塊之間,得到標(biāo)準(zhǔn)順序鏈;
對所述標(biāo)準(zhǔn)順序鏈中的文字塊進(jìn)行拼接處理,得到字符串,利用預(yù)構(gòu)建的實(shí)體識別模型對所述字符串進(jìn)行字段抽取,得到輸出字段集,并對所述輸出字段集進(jìn)行格式化處理,得到目標(biāo)信息集。
可選地,所述對所述原始圖像進(jìn)行圖像主體提取處理,得到標(biāo)準(zhǔn)圖像,包括:
利用預(yù)設(shè)的邊緣檢測算法對所述原始圖像進(jìn)行邊緣檢測處理,得到初始圖像;
對所述初始圖像進(jìn)行仿射變換,得到標(biāo)準(zhǔn)圖像。
可選地,所述利用預(yù)設(shè)的邊緣檢測算法對所述原始圖像進(jìn)行邊緣檢測處理,得到初始圖像,包括:
對所述原始圖像進(jìn)行高斯濾波,得到降噪圖像;
計算所述降噪圖像中每個像素點(diǎn)的梯度值,根據(jù)所述梯度值篩選邊緣像素點(diǎn);
提取所述邊緣像素點(diǎn)組成的區(qū)域,得到所述初始圖像。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安銀行股份有限公司,未經(jīng)平安銀行股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011502197.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





