日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]基于詞庫(kù)的OCR語(yǔ)義校正方法、系統(tǒng)、介質(zhì)、設(shè)備、終端在審

專利信息
申請(qǐng)?zhí)枺?/td> 202110984517.9 申請(qǐng)日: 2021-08-25
公開(公告)號(hào): CN113704403A 公開(公告)日: 2021-11-26
發(fā)明(設(shè)計(jì))人: 廖偉;石珺;李志鵬;郭認(rèn)飛 申請(qǐng)(專利權(quán))人: 深圳市網(wǎng)聯(lián)安瑞網(wǎng)絡(luò)科技有限公司
主分類號(hào): G06F16/33 分類號(hào): G06F16/33;G06F16/335;G06F40/30
代理公司: 廣東普潤(rùn)知識(shí)產(chǎn)權(quán)代理有限公司 44804 代理人: 寇闖
地址: 518000 廣東省深圳市福田區(qū)華富街道新田社*** 國(guó)省代碼: 廣東;44
權(quán)利要求書: 查看更多 說(shuō)明書: 查看更多
摘要:
搜索關(guān)鍵詞: 基于 詞庫(kù) ocr 語(yǔ)義 校正 方法 系統(tǒng) 介質(zhì) 設(shè)備 終端
【說(shuō)明書】:

發(fā)明公開一種基于詞庫(kù)的OCR語(yǔ)義校正方法、系統(tǒng)、介質(zhì)、設(shè)備、終端,涉及語(yǔ)義網(wǎng)絡(luò)技術(shù)領(lǐng)域。過濾出所有字符識(shí)別置信度小于閾值0.4的字符,每個(gè)字符記錄前5的結(jié)果;分別對(duì)置信度小于閾值0.4的字符的5種結(jié)果提取嫌疑詞,最終對(duì)應(yīng)得到5組嫌疑詞,每組嫌疑詞會(huì)有1個(gè)或多個(gè)嫌疑詞;按照置信度順序從高到低的順序,分別對(duì)5組嫌疑詞和詞庫(kù)進(jìn)行匹配,分別計(jì)算匹配距離,匹配距離采用編輯距離評(píng)估;以匹配距離最小的結(jié)果作為結(jié)果輸出。本發(fā)明結(jié)合字符識(shí)別結(jié)果top5和詞庫(kù),精準(zhǔn)定位識(shí)別錯(cuò)誤字符,有針對(duì)性地對(duì)識(shí)別錯(cuò)誤字符進(jìn)行高效率糾錯(cuò),保證識(shí)別結(jié)果的語(yǔ)義正確性。

技術(shù)領(lǐng)域

本發(fā)明屬于語(yǔ)義網(wǎng)絡(luò)技術(shù)領(lǐng)域,尤其涉及一種基于詞庫(kù)的OCR語(yǔ)義校正方法、系統(tǒng)、接收用戶輸入程序存儲(chǔ)介質(zhì)、計(jì)算機(jī)設(shè)備、信息數(shù)據(jù)處理終端,可應(yīng)用于人工智能、深度學(xué)習(xí)、計(jì)算機(jī)圖像視覺。

背景技術(shù)

OCR(Optical Character Recognition)技術(shù)在對(duì)印刷質(zhì)量較好的文本的識(shí)別上已經(jīng)基本成熟,市面上有些軟件對(duì)這些文本的單字識(shí)別率可以達(dá)到非常高。但對(duì)于一些印刷質(zhì)量較低或字跡模糊的文本,OCR的單字識(shí)別率則會(huì)明顯下降,必須依靠后處理技術(shù)來(lái)提高全文的整體識(shí)別率。目前后處理技術(shù)中的較為常用并且有效的主要有兩種方式,一種方式是基于詞庫(kù)的匹配技術(shù),這種技術(shù)對(duì)于雙字詞或多字詞的識(shí)別有良好的效果,但無(wú)法對(duì)錯(cuò)誤詞的精準(zhǔn)定位及糾錯(cuò),導(dǎo)致效率低。另一種方式是基于自然語(yǔ)言處理(NaturalLanguange Process簡(jiǎn)稱NLP)技術(shù),適用于檢測(cè)錯(cuò)誤詞,但難于預(yù)測(cè)正確詞容易出現(xiàn)誤糾錯(cuò)。

目前,在自然語(yǔ)言處理領(lǐng)域,現(xiàn)有的語(yǔ)言模型通常依賴于機(jī)器學(xué)習(xí)算法。機(jī)器學(xué)習(xí)的本質(zhì)是預(yù)測(cè);在通過大量的訓(xùn)練數(shù)據(jù)集對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練,得到自然語(yǔ)言處理模型后,就能夠?qū)⒋幚頂?shù)據(jù)輸入至訓(xùn)練好的自然語(yǔ)言處理模型,獲得與待處理數(shù)據(jù)對(duì)應(yīng)的預(yù)測(cè)結(jié)果。

字符分割和字符識(shí)別是光學(xué)字符識(shí)別(英文全稱:Optical CharacterRecognition,英文縮寫:OCR)技術(shù)中最重要的兩個(gè)方面,這兩部分直接影響到字符識(shí)別的效果和結(jié)果,在OCR技術(shù)中需要將分割好的字符進(jìn)行行方向上的排序后呈現(xiàn)給用戶,因此字符的行方向排序技術(shù)會(huì)直接影響到呈現(xiàn)給用戶觀看的識(shí)別效果。但是當(dāng)前對(duì)于OCR的分行技術(shù)主要是基于分割后字符間距來(lái)對(duì)字符進(jìn)行簡(jiǎn)單的分行。

現(xiàn)有技術(shù)中依據(jù)分割后的字符間距來(lái)進(jìn)行字符的合并和拆分,當(dāng)不同格式的字符進(jìn)行排版后,拍攝到的每行字符在頁(yè)面中有很大傾斜等情況發(fā)生時(shí),對(duì)頁(yè)面上中的字符識(shí)別存在較大的誤差,并且在后續(xù)利用識(shí)別結(jié)果進(jìn)行語(yǔ)義分析時(shí)也很難達(dá)到很高的準(zhǔn)確性。另外,現(xiàn)有技術(shù)中對(duì)字符分行是根據(jù)字符間距實(shí)現(xiàn)的,但隨著環(huán)境變化在把字符塊組合成行時(shí)有很大可能會(huì)被其它字符所影響,從而會(huì)影響最終所給出的識(shí)別效果。

再者現(xiàn)有技術(shù)公開:基于自然語(yǔ)言處理技術(shù)的語(yǔ)義校正方法;基于上下文語(yǔ)義詞庫(kù)的OCR識(shí)別方法。

通過上述分析,現(xiàn)有技術(shù)存在的問題及缺陷為:

(1)常見的詞匹配技術(shù)需要對(duì)識(shí)別的句子種所有的詞匯進(jìn)行匹配,沒有針對(duì)性盲目糾錯(cuò)效率低;

(2)基于自然語(yǔ)言處理技術(shù)的語(yǔ)義校正方法適合于檢測(cè)錯(cuò)誤詞,難于預(yù)測(cè)正確詞容易出現(xiàn)誤糾錯(cuò);

(3)基于自然語(yǔ)言處理技術(shù)的語(yǔ)義校正方法需要大量標(biāo)注預(yù)料,難于實(shí)現(xiàn)。

解決以上問題及缺陷的難度為:

需要保證一份完整的中文詞匯庫(kù)。

解決以上問題及缺陷的意義為:意義在于對(duì)識(shí)別出來(lái)的文字進(jìn)行錯(cuò)別字過濾后,能利用完整的中文詞匯庫(kù)對(duì)錯(cuò)別字的上下文組合的嫌疑詞進(jìn)行匹配,匹配出最合適的詞匯,達(dá)到糾錯(cuò)的功能。

發(fā)明內(nèi)容

為克服相關(guān)技術(shù)中存在的問題,本發(fā)明公開實(shí)施例提供了一種基于詞庫(kù)的OCR語(yǔ)義校正方法、系統(tǒng)、接收用戶輸入程序存儲(chǔ)介質(zhì)、計(jì)算機(jī)設(shè)備、信息數(shù)據(jù)處理終端。所述技術(shù)方案如下:

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市網(wǎng)聯(lián)安瑞網(wǎng)絡(luò)科技有限公司,未經(jīng)深圳市網(wǎng)聯(lián)安瑞網(wǎng)絡(luò)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110984517.9/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說(shuō)明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 手机看片国产一区| 色午夜影院| 午夜精品在线观看| 一区二区三区国产精品| 中文字幕1区2区3区| 午夜a电影| 国产精品久久久久久久久久久不卡| 国产欧美日韩精品一区二区三区 | 久久精品国产一区二区三区| 日本三级香港三级| 欧美色综合天天久久| 国产一二三区免费| 欧美高清性xxxxhd| 日韩精品一区二区中文字幕| 真实的国产乱xxxx在线91| 最新av中文字幕| 在线观看v国产乱人精品一区二区| 欧美日韩三区二区| 欧美视频1区| 综合久久一区二区三区| 波多野结衣女教师电影| 少妇av一区二区三区| 国产精品高潮呻吟88av| 国产一区二区三区精品在线| 91久久精品在线| 中文字幕欧美久久日高清| 国产精品天堂| 国产精品一二三四五区| 国产精品久久久久精| 国产一二三区免费| 久久影视一区二区| 不卡在线一区二区| 99久久婷婷国产亚洲终合精品 | 国产欧美日韩va另类在线播放| 91精品视频一区二区| 午夜特级片| 狠狠色噜噜狠狠狠狠2021天天| 国产乱人伦偷精品视频免下载| 欧美日韩国产在线一区二区三区| 日本精品一区二区三区视频| 亚洲一区二区三区加勒比| 91丝袜诱惑| 狠狠色综合久久婷婷色天使| 91日韩一区二区三区| 国产精品日韩视频| 91精品综合在线观看| 狠狠色丁香久久综合频道 | 色就是色欧美亚洲| 欧美一区二区三区国产精品| 在线观看黄色91| 国产精品高潮呻吟88av| 91精品国产综合久久国产大片 | 久久精品欧美一区二区| 欧美乱妇高清无乱码| 日本一二三不卡| 国产精品久久久久免费a∨大胸 | 日本伦精品一区二区三区免费| 国产三级欧美三级日产三级99| 99精品免费在线视频| 日本精品一二三区| 99国产精品| 北条麻妃久久99精品| 最新日韩一区| 欧美激情午夜| 欧美大片一区二区三区| 丰满少妇在线播放bd日韩电影| 91热精品| 99re6国产露脸精品视频网站| 欧美一区二区三区中文字幕| 国模吧一区二区| 夜色av网站| 性生交大片免费看潘金莲| 亚洲精品国产精品国产| 久久免费精品国产| 亚洲欧美色图在线| 欧美hdxxxx| 91精品啪在线观看国产| 久久精视频| 91精品第一页| 精品久久不卡| 大bbw大bbw巨大bbb| 午夜毛片在线观看| 手机看片国产一区| 妖精视频一区二区三区| 国产精品电影免费观看| 色偷偷一区二区三区| 精品99免费视频| 精品国产免费久久| 午夜影院一区二区| 久久久久国产亚洲| 精品国产区| 亚洲精品20p| 日韩精品一区二区三区在线 | 91狠狠操| 日韩av中文字幕在线免费观看| 搡少妇在线视频中文字幕| 国产69精品久久久久孕妇不能看| 偷拍区另类欧美激情日韩91| 国产91高清| 91看片淫黄大片91| 国产99久久九九精品| 日本美女视频一区二区三区| 日韩无遮挡免费视频| 亚洲欧美一区二区三区不卡| 激情久久一区| 国模精品免费看久久久| 久久99精品久久久噜噜最新章节 | 亚洲精品无吗| 欧美视频1区| 国产精品久久久久久久久久久久久久久久久久| 中文字幕av一区二区三区高| 国产中文字幕91| 国产视频一区二区视频| 日韩av三区| 蜜臀久久99静品久久久久久| 国产理论一区二区三区| 久久久久国产亚洲| 国产一区二区伦理片| 一区二区三区在线影院| 99精品一区| 日韩欧美中文字幕一区| 国产精品刺激对白麻豆99| 欧美一区二区三区在线视频观看| 亚洲精品性| 久久二区视频| 自拍偷在线精品自拍偷写真图片| 久久久中精品2020中文| 91国产在线看| 少妇高潮一区二区三区99小说| 中文字幕一区二区三区免费视频| 欧美日韩综合一区 | 日韩精品在线一区二区三区| 国产一区三区四区| 一区不卡av| 日韩精品免费播放| 高清国产一区二区三区 | 99国产精品久久久久99打野战| 欧美日韩偷拍一区| 日韩精品一区二区免费| 欧美中文字幕一区二区| 国产日韩精品一区二区| 国产农村妇女精品一二区| 国产精品久久久久激情影院| 欧美在线视频一二三区| 精品国产亚洲一区二区三区| 性夜影院在线观看| 日韩午夜一区| 福利视频亚洲一区| 高清在线一区二区| 国产在线精品一区| 性欧美一区二区三区| 国产伦精品一区二区三区无广告| www.午夜av| 理论片高清免费理伦片| 亚洲精品20p| 日本神影院一区二区三区| 国产乱码一区二区| 亚洲一区二区福利视频| 一区二区不卡在线| 爱看av在线入口| 性国产日韩欧美一区二区在线| 99视频国产在线| 狠狠色综合欧美激情| 免费久久一级欧美特大黄| 国产床戏无遮挡免费观看网站| 中文字幕在线乱码不卡二区区| 精品国产免费一区二区三区| 91久久国产露脸精品| 96精品国产| 国产麻豆一区二区| 国产午夜精品一区二区三区欧美| 欧美日韩国产区| 国产主播啪啪| 亚洲神马久久| 国产盗摄91精品一区二区三区| 国产欧美一区二区精品久久久| 色午夜影院| 国产精品一二三四五区| 国产一级一区二区| 国产视频二区在线观看| 国产免费一区二区三区网站免费| 精品福利一区二区| 久久国产精彩视频| 日本边做饭边被躁bd在线看| 亚洲精品97久久久babes| 国产精品一区二区三| 国产一区二区国产| 99精品小视频| 国产精品一区在线观看你懂的| 玖玖玖国产精品| 黄毛片在线观看| 欧美一区二区三区久久精品视| 色婷婷久久一区二区三区麻豆| 亚洲一卡二卡在线| 国产精一区二区三区| 国产精品亚洲а∨天堂123bt| 国产在线干| 日韩av在线电影网| 狠狠躁天天躁又黄又爽| 99久久久国产精品免费无卡顿| 天干天干天啪啪夜爽爽99| 免费看农村bbwbbw高潮| 日本久久不卡| 国产69精品久久777的优势| 大bbw大bbw超大bbw| 欧美一区二三区人人喊爽| 国产1区在线观看| 国产超碰人人模人人爽人人添| 97精品久久久午夜一区二区三区| 中文字幕一区二区三区乱码视频| 国产欧美一二三区| 久久一级精品视频| 日韩精品1区2区3区| 91人人爽人人爽人人精88v| 激情久久一区二区| 久久一级精品视频| 日本午夜影视| 欧美69精品久久久久久不卡| 午夜a电影| 一本色道久久综合亚洲精品图片 | 日韩精品在线一区二区三区| 日韩有码一区二区三区| 亚洲国产精品肉丝袜久久| 欧美久久精品一级c片| 亚洲欧美视频一区二区| 国产精品免费一区二区区| 日韩精品一区在线观看| 色噜噜狠狠色综合久| 天堂av色婷婷一区二区三区| 中文字幕一级二级三级| 538国产精品一区二区| 好吊色欧美一区二区三区视频| 日本看片一区二区三区高清| 亚洲精品一品区二品区三品区 | 狠狠色狠狠色88综合日日91| 一区二区三区免费高清视频| 久久五月精品| 欧美日韩一区二区三区在线播放 | 高清人人天天夜夜曰狠狠狠狠| 国产欧美精品一区二区三区-老狼| 精品国产仑片一区二区三区| 国产精品一区亚洲二区日本三区 | 欧美一区二区综合| 久久中文一区二区| 91亚洲国产在人线播放午夜| 精品久久久久久中文字幕大豆网|