[發(fā)明專利]文本糾錯方法、裝置、電子設(shè)備及計算機(jī)可讀存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202010326324.X | 申請日: | 2020-04-23 |
| 公開(公告)號: | CN111626118A | 公開(公告)日: | 2020-09-04 |
| 發(fā)明(設(shè)計)人: | 謝靜文;阮曉雯;徐亮 | 申請(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/34;G06N3/04;G06N3/08;G06F40/279;G06F16/903 |
| 代理公司: | 深圳市沃德知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 糾錯 方法 裝置 電子設(shè)備 計算機(jī) 可讀 存儲 介質(zhì) | ||
本發(fā)明涉及一種人工智能技術(shù),揭露了一種文本糾錯方法,包括:獲取原始文本圖像,將所述原始文本圖像進(jìn)行預(yù)處理操作,得到標(biāo)準(zhǔn)圖像;利用預(yù)先訓(xùn)練完成的文本識別模型對所述標(biāo)準(zhǔn)圖像進(jìn)行文本識別,得到字/詞向量,并對所述字/詞向量編碼,生成鍵值和對應(yīng)的結(jié)果值,根據(jù)所述鍵值和對應(yīng)的結(jié)果值,將所述標(biāo)準(zhǔn)圖像轉(zhuǎn)換為輸出文本;利用所述鍵值計算所述輸出文本與預(yù)設(shè)的標(biāo)準(zhǔn)糾錯表的編輯距離,根據(jù)所述編輯距離得到所述輸出文本中的錯誤文本及所述錯誤文本對應(yīng)的正確文本;利用所述正確文本替換所述錯誤文本,得到標(biāo)準(zhǔn)輸出文本。本發(fā)明還提出一種文本糾錯裝置、電子設(shè)備以及一種計算機(jī)可讀存儲介質(zhì)。本發(fā)明可以解決文本糾錯精度低,成本高的問題。另外,本發(fā)明還涉及區(qū)塊鏈技術(shù),也試用于智慧城市領(lǐng)域中。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能技術(shù)領(lǐng)域,尤其涉及一種文本糾錯方法、裝置、電子設(shè)備及計算機(jī)可讀存儲介質(zhì)。
背景技術(shù)
目前文本識別的方法多為利用OCR技術(shù)把圖像中的文字讀取出來,并轉(zhuǎn)換成一種計算機(jī)能夠接受、人可以理解的字符格式。但是由于OCR技術(shù)對輸入圖像的質(zhì)量要求很高,在圖像精度較低的情況下容易出現(xiàn)大量的識別錯誤的情況,因此需要對識別出的字符進(jìn)行糾錯處理。但是傳統(tǒng)方法只根據(jù)圖像信息中的字符進(jìn)行糾錯,導(dǎo)致OCR直接輸出的糾錯結(jié)果無法滿足實(shí)際應(yīng)用要求,準(zhǔn)確率較低。因此如何實(shí)現(xiàn)低成本,高精度的文本糾錯越來越被人們所重視。
發(fā)明內(nèi)容
本發(fā)明提供一種文本糾錯方法、裝置、電子設(shè)備及計算機(jī)可讀存儲介質(zhì),其主要目的在于解決文本糾錯精度低,成本高的問題。
為實(shí)現(xiàn)上述目的,本發(fā)明提供的一種文本糾錯方法,包括:
獲取原始文本圖像,將所述原始文本圖像進(jìn)行預(yù)處理操作,得到標(biāo)準(zhǔn)圖像;
利用預(yù)先訓(xùn)練完成的文本識別模型對所述標(biāo)準(zhǔn)圖像進(jìn)行文本識別,得到字/詞向量,并對所述字/詞向量編碼,生成鍵值和對應(yīng)的結(jié)果值,根據(jù)所述鍵值和對應(yīng)的結(jié)果值,將所述標(biāo)準(zhǔn)圖像轉(zhuǎn)換為輸出文本;
利用所述鍵值計算所述輸出文本與預(yù)設(shè)的標(biāo)準(zhǔn)糾錯表的編輯距離,根據(jù)所述編輯距離得到所述輸出文本中的錯誤文本及所述錯誤文本對應(yīng)的正確文本;
利用所述正確文本替換所述錯誤文本,得到標(biāo)準(zhǔn)輸出文本。
可選地,所述將所述原始文本圖像進(jìn)行預(yù)處理操作,得到標(biāo)準(zhǔn)圖像,包括:
將所述原始文本圖像的圖像信號進(jìn)行放大處理,得到放大圖像信號;
對所述放大圖像信號進(jìn)行采樣,得到采樣信號;
將所述采樣信號進(jìn)行濾波處理,得到所述標(biāo)準(zhǔn)圖像。
可選地,所述文本識別模型包括:
字/詞向量層,用于將所述標(biāo)準(zhǔn)圖像包含的文本中的單詞和字符進(jìn)行轉(zhuǎn)化,獲得字/詞向量;
Bi-LSTM層,用于將所述字/詞向量進(jìn)行分割,對分割后的所述字/詞向量進(jìn)行編碼,得到所述字/詞向量的編碼表征,利用所述編碼表征對所述字/詞向量進(jìn)行標(biāo)注,得到鍵值和結(jié)果值;
CRF層,用于將相同類型的鍵值和結(jié)果值進(jìn)行拼接,將拼接完成的文本按照編碼的逆過程進(jìn)行解碼,生成所述輸出文本。
可選地,所述計算所述輸出文本與預(yù)設(shè)的標(biāo)準(zhǔn)糾錯表的編輯距離,包括:
利用如下編輯距離算法計算所述編輯距離:
Simtopic=Pearson(R,S)
其中,R為所述輸出文本的鍵值,S為標(biāo)準(zhǔn)糾錯表的鍵值,Pearson為編輯距離運(yùn)算,Simtopic為鍵值之間的編輯距離。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010326324.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種高效清潔液
- 下一篇:一種生物可降解的血管支架材料的制備方法
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計算機(jī)可讀存儲介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計算機(jī)設(shè)備和存儲介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲介質(zhì)
- 文本生成方法、裝置和電子設(shè)備





