[發明專利]文字識別矯正的方法在審
| 申請號: | 202011482957.6 | 申請日: | 2020-12-16 |
| 公開(公告)號: | CN112507080A | 公開(公告)日: | 2021-03-16 |
| 發明(設計)人: | 呂學強;游新冬;董志安 | 申請(專利權)人: | 北京信息科技大學 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F40/289;G06F40/232;G06F40/166 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100192 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文字 識別 矯正 方法 | ||
本申請公開了一種文字識別矯正的方法,包括:構建專業詞庫;構建識別結果區域矩陣;矯正。本申請的文字識別矯正的方法,通過引入語言模型,統計條件概率預測最佳符合詞庫的識別結果,通過檢測項對應關系,進行前后矯正,進一步提高識別精確度,最后通過融合編輯距離和最長公共子序列的識別方法匹配最佳的識別結果,提高了識別準確率,能夠很好地滿足實際應用的需要。
技術領域
本申請涉及計算機視覺技術領域,具體涉及一種文字識別矯正的方法。
背景技術
近年來,隨著深度學習和人工智能的不斷發展與進步,計算機視覺領域成為熱點研究方向,吸引了來自學術界與工業界的廣泛關注。計算機視覺通過其對圖像的強大的解讀能力,為各行各業提供了技術支持。其中,醫療領域提出了智慧醫療的建設,并在近些年取得了突破性進展。化驗檢測對于就醫患者必不可少,同時會產生大量的醫療化驗單,極大的增加了醫生的工作量。自2005年起,由Google不斷維護的開源的Tesseract-OCR在文字識別領域取得優異的成績,使整個學術界以及工業界掀起了一股人工智能的浪潮,各類文字識別算法應運而生。在醫療領域,OCR技術可以通過識別化驗單文字,結合醫療信息系統,利用人工智能與大數據對化驗單進行初步的解讀,不僅能夠使患者得到及時的就診,同時也可以減輕工作人員的工作量,大大提升診斷效率。OCR全稱Optical CharacterRecognition,中文翻譯為光學字符識別。對于自然場景下化驗單文字識別后處理,目前存在的后處理方法都存在一定的缺陷。例如:編輯距離算法對于較短序列或識別結果出現缺失、增加等情況效果并不理想;最長公共子序列算法可以克服文字的缺失或增添,但在多個序列擁有相同公共子序列時,矯正會出現爭議;語言模型只是在預測時有多個預測結果,通過構建識別矩陣,找到最優的組合路徑;等等。這些缺陷導致自然場景下化驗單識別效果欠佳。
發明內容
本申請的目的是提供一種文字識別矯正的方法。為了對披露的實施例的一些方面有一個基本的理解,下面給出了簡單的概括。該概括部分不是泛泛評述,也不是要確定關鍵/重要組成元素或描繪這些實施例的保護范圍。其唯一目的是用簡單的形式呈現一些概念,以此作為后面的詳細說明的序言。
根據本申請實施例的一個方面,提供一種文字識別矯正的方法,包括:
構建專業詞庫;
構建識別結果區域矩陣;
矯正。
進一步地,所述矯正包括:
基于語言模型進行矯正;
基于編輯距離和最長公共子序列進行矯正;
基于對應關系進行矯正。
進一步地,基于語言模型進行矯正,包括:
語言模型通過概率分布來統計字符出現的概率,通過統計結果,計算最大的條件概率;第一個檢測區域識別的結果S1,選取CRNN網絡給出的前三個候選字,每個候選區域的概率W(S1)根據網絡預測的概率重新歸一化,第二個候選區域識別結果S2,選取CRNN網絡給出的前三個候選字,每個候選區域的概率W(S2)根據網絡預測的概率重新歸一化,第二個候選區域識別結果S2,選取CRNN網絡給出的前三個候選字,每個候選區域的概率W(S3)根據網絡預測的概率重新歸一化;
根據概率統計分析,條件概率P(S2|S1),即S1出現的情況下后面接S2的概率;
f=W(S1)P(S2|S1)W(S2)P(S3|S2)W(S3)
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京信息科技大學,未經北京信息科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011482957.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種乙基纖維素中空微囊
- 下一篇:融合實體關鍵字特征的醫療領域實體分類方法





