[發明專利]一種基于像素級多特征聯合分類的手寫體字符的提取方法有效
| 申請號: | 201911253552.2 | 申請日: | 2019-12-09 |
| 公開(公告)號: | CN110991439B | 公開(公告)日: | 2023-04-28 |
| 發明(設計)人: | 田博帆 | 申請(專利權)人: | 南京紅松信息技術有限公司 |
| 主分類號: | G06V30/148 | 分類號: | G06V30/148;G06V30/14;G06V30/19;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 南京正聯知識產權代理有限公司 32243 | 代理人: | 顧伯興 |
| 地址: | 210022 江蘇省南京*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 像素 特征 聯合 分類 手寫體 字符 提取 方法 | ||
本發明公開了一種基于像素級多特征聯合分類的手寫體字符的提取方法,具體步驟包括:(1)字符定位:通過字符連通域算法或目標識別檢測YoLo?v3算法對圖片中的文本字符進行定位處理;(2)樣本收集:收集含手寫體文本字符和印刷體文本字符的重疊字符的真實樣本,再通過合成方式追加若干個類真實的樣本;(3)特征提取:對文本字符樣本進行多特征提取,獲得文本字符圖;(4)像素分類:對文本字符的特征進行像素級分類,再對字符像素特征進行分類處理,獲得字符特征的像素分類結果;(5)字符提取:根據像素分類結果,對圖片中的像素位進行篩選并將判斷為印刷體的字符像素的灰度值設置為白色,從而去除印刷體字符,提取出手寫體字符。
技術領域
本發明屬于文本圖像處理技術領域,尤其是涉及一種基于像素級多特征聯合分類的手寫體字符的提取方法。
背景技術
隨著人工智能信息化時代的發展,圖像識別技術逐漸興起并已深入至各個行業,徹底改變了人類的生產和生活方式。然而技術的不斷迭代更新,在傳統圖像識別領域,原本難以完成的圖像處理任務,現階段可通過人工智能方法實現圖像處理的任務需求,彌補傳統方法存在的不足。
隨著科技的發展,隨著人工智能的到來,新的一輪技術革命已然開始;計算機已逐步取代了人工的繁重工作。例如,在文本識別領域,由于大量文本信息待處理,傳統的人工審閱方式已然無法滿足需求;或者學生考試使用的部分自動批閱系統,以及票據、憑據等的識別錄入系統,這些不僅節省了由人工參與而浪費的大量時間,同時提高了工作效率。但作為文本識別系統,對其識別的精度一直以來都有很高的要求,也是目前研究的重點;文本識別主要分為手寫體識別和印刷體識別兩種,考慮到手寫體書寫的隨意性和復雜性等特點,混合識別變的非常有難度,大多數的識別系統都是將其分開進行識別;伴隨智能化識別系統的發展,開始逐漸打破了舊的格局,開辟新的天地;文本識別的前提是先對文本進行定位,實際識別應用中文本大多為印刷體和手寫體字符的混合,而手寫體通常為識別的重點目標,故需提前對待識別的手寫體做出精確定位變得至關重要。
圖像識別技術的本質是通過計算機對圖像進行預處理、提取圖像特征再加以分析和理解,以識別圖像中的目標和對象的技術。圖像識別技術的區別在于圖像處理方法的不同,人工智能識別技術相比傳統識別技術更具優勢,它主要是采用了人工神經網絡,通過卷積的方式處理圖像,不僅高效可靠,而且學習到的模型能夠無限逼近真實預測函數。在文本圖像識別領域,涉及眾多的圖像處理技術,包括:圖像預處理技術、圖像分割技術和圖像分類技術等。其中,圖像分割技術是圖像處理到圖像分析的關鍵技術,它是將圖像分成若干個特定獨立的區域,并對每個具有獨特性質的區域進行感興趣目標提取的技術過程。目前,圖像分割方法主要分為四類:基于閾值的分割方法、基于區域的分割方法、基于邊緣的分割方法以及基于特定理論的分割方法等。此外,每類技術在一定程度上相互融合,如圖像分割技術涉及到圖像分類技術,圖像分離技術又涉及到圖像分割技術,同時圖像分類技術作為圖像識別的核心技術已被廣泛應用,有關它的研究仍在繼續深入。
因此,有必要開發一種基于像素級多特征聯合分類的手寫體字符的提取方法,一種基于像素級多特征聯合分類的手寫體字符提取技術,它屬于無模板分離技術,可在提取字符像素特征的基礎上對每個像素進行分類,達到手寫印刷字符完全分離的目的,進而提取出手寫體字符。
發明內容
本發明要解決的技術問題是,提供一種基于像素級多特征聯合分類的手寫體字符的提取方法,對同時含有印刷體和手寫體圖片中的手寫體部分做出精確定位,提高文本識別系統的精確度。
為解決上述技術問題,本發明采用的技術方案是:該基于像素級多特征聯合分類的手寫體字符的提取方法,具體包括以下步驟:
(1)字符定位:通過字符連通域算法或目標識別檢測YoLo?v3算法對圖片中的文本字符進行定位處理,獲取所述文本字符的定位坐標;
(2)樣本收集:收集含手寫體文本字符和印刷體文本字符的重疊字符的真實樣本,再通過合成方式追加若干個類真實的樣本,獲得重疊文本字符樣本;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京紅松信息技術有限公司,未經南京紅松信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911253552.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種金屬錠冷卻成型裝置
- 下一篇:一種生態浮床及使用其進行魚菜共生的方法





