[發(fā)明專利]基于OCR和可信結(jié)構(gòu)化數(shù)據(jù)的信息鑒別方法有效
| 申請?zhí)枺?/td> | 201810958615.3 | 申請日: | 2018-08-22 |
| 公開(公告)號: | CN109145819B | 公開(公告)日: | 2022-02-11 |
| 發(fā)明(設(shè)計)人: | 王佩光;楊小蕾;羅奕;朱友衛(wèi);林雄建;肖鄭海;陳龍;潘盛裕;孟浩 | 申請(專利權(quán))人: | 國網(wǎng)信通億力科技有限責任公司;國網(wǎng)信息通信產(chǎn)業(yè)集團有限公司;國家電網(wǎng)有限公司 |
| 主分類號: | G06V30/42 | 分類號: | G06V30/42;G06V30/262;G06F16/242 |
| 代理公司: | 北京鍾維聯(lián)合知識產(chǎn)權(quán)代理有限公司 11579 | 代理人: | 趙中璋 |
| 地址: | 361009 福建省廈門*** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 ocr 可信 結(jié)構(gòu) 數(shù)據(jù) 信息 鑒別方法 | ||
本發(fā)明涉及一種一種基于OCR和可信結(jié)構(gòu)化數(shù)據(jù)庫的信息鑒別方法,包括:步驟S100,對信息載體(紙)的一個或多個影像進行OCR處理,獲得信息載體的主索引內(nèi)容CI、第一內(nèi)容向量A=(a1,a2,...,am)和第二內(nèi)容向量B=(b1,b2,...,bn),其中m和n分別為第一、二內(nèi)容向量中元素的數(shù)量;步驟S200,在可信結(jié)構(gòu)化數(shù)據(jù)庫中使用主索引內(nèi)容CI進行檢索,并將檢索獲得結(jié)果記錄中提取第一可信內(nèi)容向量P=(p1,p2,...,pm)和第二可信內(nèi)容向量Q=(q1,q2,...,qn);步驟S300,如果A=P,那么執(zhí)行步驟S400;如果A≠P,那么向用戶提示所述影像中呈現(xiàn)的內(nèi)容為虛假內(nèi)容;步驟S400,計算B和Q的相似度其中,bqi為bi和qi的相似度,如果SBQ≥D,那么判斷所述影像中呈現(xiàn)的內(nèi)容為真實內(nèi)容;否則,向用戶提示影像中呈現(xiàn)的內(nèi)容為虛假內(nèi)容。
技術(shù)領(lǐng)域
本發(fā)明涉及信息鑒別領(lǐng)域,尤其涉及一種基于OCR和可信結(jié)構(gòu)化數(shù)據(jù)的信息鑒別方法。
背景技術(shù)
目前的很多情況下,需要對用戶提供的紙件承載的信息中的內(nèi)容進行鑒真,例如用戶提供的身份證復印件、企業(yè)營業(yè)執(zhí)照中的是否被篡改,以及用戶提供的紙質(zhì)招標文件中的企業(yè)資質(zhì)信用是否準確、真實等。現(xiàn)有技術(shù)中,對于紙件承載的信息的鑒別主要通過人工比對完成,自動化程度較低、鑒別的效率也較低。OCR技術(shù)的發(fā)展為解決上述問題提供了契機。
發(fā)明內(nèi)容
為解決上述技術(shù)問題,本發(fā)明涉及一種基于OCR和可信結(jié)構(gòu)化數(shù)據(jù)庫的信息鑒別方法,包括:步驟S100,對信息載體(紙)的一個或多個影像進行OCR處理,獲得信息載體的主索引內(nèi)容CI、第一內(nèi)容向量A=(a1,a2,...,am)和第二內(nèi)容向量B=(b1,b2,...,bn),其中m和n分別為第一、二內(nèi)容向量中元素的數(shù)量;步驟S200,在可信結(jié)構(gòu)化數(shù)據(jù)庫中使用主索引內(nèi)容CI進行檢索,并將檢索獲得結(jié)果記錄中提取第一可信內(nèi)容向量P=(p1,p2,...,pm)和第二可信內(nèi)容向量Q=(q1,q2,...,qn);步驟S300,如果A=P,那么執(zhí)行步驟S400;如果A≠P,那么向用戶提示所述影像中呈現(xiàn)的內(nèi)容為虛假內(nèi)容;步驟S400,計算B和Q的相似度其中,bqi為bi和qi的相似度,如果SBQ≥D,那么判斷所述影像中呈現(xiàn)的內(nèi)容為真實內(nèi)容;否則,向用戶提示影像中呈現(xiàn)的內(nèi)容為虛假內(nèi)容。
具體實施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,將對本發(fā)明作進一步地詳細描述。這種描述是通過示例而非限制的方式介紹了與本發(fā)明的原理相一致的具體實施方式,這些實施方式的描述是足夠詳細的,以使得本領(lǐng)域技術(shù)人員能夠?qū)嵺`本發(fā)明,在不脫離本發(fā)明的范圍和精神的情況下可以使用其他實施方式并且可以改變和/或替換各要素的結(jié)構(gòu)。因此,不應當從限制性意義上來理解以下的詳細描述。
根據(jù)本發(fā)明,提供了一種基于OCR和可信結(jié)構(gòu)化數(shù)據(jù)庫的信息鑒別方法,包括:
步驟S100,對信息載體的一個或多個影像進行OCR處理,獲得信息載體的主索引內(nèi)容CI、第一內(nèi)容向量A=(a1,a2,...,am)和第二內(nèi)容向量B=(b1,b2,...,bn),其中m和n分別為第一、二內(nèi)容向量中元素的數(shù)量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國網(wǎng)信通億力科技有限責任公司;國網(wǎng)信息通信產(chǎn)業(yè)集團有限公司;國家電網(wǎng)有限公司,未經(jīng)國網(wǎng)信通億力科技有限責任公司;國網(wǎng)信息通信產(chǎn)業(yè)集團有限公司;國家電網(wǎng)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810958615.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- OCR文檔識別方法及其裝置
- 智能調(diào)度多OCR識別引擎的方法及設(shè)備
- OCR掛接方法、裝置與設(shè)備
- 一種用于教學系統(tǒng)的OCR識別方法、裝置和終端
- OCR識別模型的確定方法及裝置
- 基于聯(lián)邦OCR模型的字符檢測方法、裝置、設(shè)備和介質(zhì)
- OCR系統(tǒng)的評估方法、裝置、設(shè)備及可讀存儲介質(zhì)
- OCR模型訓練方法、系統(tǒng)及裝置
- 識別轉(zhuǎn)換圖像文件的方法、系統(tǒng)、計算機設(shè)備及存儲介質(zhì)
- OCR訓練數(shù)據(jù)生成方法、裝置、計算機設(shè)備及存儲介質(zhì)
- 卡片結(jié)構(gòu)、插座結(jié)構(gòu)及其組合結(jié)構(gòu)
- 鋼結(jié)構(gòu)平臺結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 單元結(jié)構(gòu)、結(jié)構(gòu)部件和夾層結(jié)構(gòu)
- 鋼結(jié)構(gòu)扶梯結(jié)構(gòu)
- 鋼結(jié)構(gòu)隔墻結(jié)構(gòu)
- 鋼結(jié)構(gòu)連接結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機械結(jié)構(gòu)和光學結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機械結(jié)構(gòu)和光學結(jié)構(gòu)





