[發明專利]一種特效字體識別方法及裝置有效
| 申請號: | 202111509028.4 | 申請日: | 2021-12-10 |
| 公開(公告)號: | CN113902046B | 公開(公告)日: | 2022-02-18 |
| 發明(設計)人: | 邊聰聰 | 申請(專利權)人: | 北京惠朗時代科技有限公司 |
| 主分類號: | G06V30/19 | 分類號: | G06V30/19;G06V30/244;G06V30/18;G06V30/41;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 102600 北京市大興區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 特效 字體 識別 方法 裝置 | ||
本發明提出了一種特效字體識別方法及裝置,涉及字體識別技術領域。該方法包括:利用特征算子表征,計算編號一致的相似度,若相似度大于預設值的數目未達到第一預設數目,判定待識別特效字體為非模板類別文字。利用空洞率為第一預置值的卷積核處理,計算編號一致的相似度,若相似度大于預設值的數目未達到第二預設數目,判定待識別特效字體為非模板類別文字。若相似的數量達到第三預設數目,判定待識別特效字體為非模板類別文字,否則待識別特效字體為模板類別文字。本發明分別在多個區域中利用特征算子、差異性空洞卷積計算編號一致的兩個區域的相似度,以此判斷待識別特效字體,提高對特效字體識別的精準度,達到較為精確識別特效字體的效果。
技術領域
本發明涉及字體識別技術領域,具體而言,涉及一種特效字體識別方法及裝置。
背景技術
在數字媒體時代,合同、協議、論文等不僅包含了豐富的語義信息,也可以以圖片的形式將合同、協議、論文等呈現出來,以方便大家進行閱讀。同時,文字識別技術可以較為精準地將圖片中的文字識別出來,更進一步地方便了大家對其進行編輯。
然而,合同、協議、論文中的字體往往存在明顯的多樣性,甚至會出現特效字體,顯著增加了字體識別的難度。傳統的識別方法雖然能夠對特效字體進行識別,但識別精度無法達到預期效果。
專利文獻CN113221904A公開了一種語義關聯文字識別方法及裝置,其雖然能夠通過語義關聯對每個塊中的文字進行檢驗,以對每個塊中文字之間進行語義關聯,以提高文字識別的正確率。但是若利用該專利文獻的技術方案識別合同、協議、論文中的特效字體,由于特效字體的個性化字體風格,與楷體、宋體等易識別的字體截然不同,則無法保證對特效字體的識別精度。專利文獻CN105913093B公開了一種用于文字識別處理的模板匹配方法,該方法在模板集合中進行匹配尋優,以確定待識別圖像的最優匹配模板。雖然能夠解決場景圖像的褶皺、尺度多變以及光照多變等因素對文字識別造成的影響,但是由于特效字體的個性化和多樣性,則通過該模板匹配方法無法對特效字體進行有效識別。專利文獻CN112784932A公開了一種字體識別方法、裝置和存儲介質,該字體識別方法、裝置和存儲介質通過提取每一個字體圖片的特征點,再分別進行文本區域圖片和每一個字體圖片特征點匹配,以確定對應的特征相似度,進而選定特征相似度最大的字體圖片所對應的字體為所述文本區域圖片的字體。由于楷體、宋體等易識別的字體不僅特征點明顯且是統一性字體,采用該字體識別方法、裝置和存儲介質可以起到一定的識別效果,但是對于多樣化且非統一的特效字體而言,僅僅憑借特征點無法進行有效匹配,則達不到預期的識別精度。
發明內容
本發明的目的在于提供一種特效字體識別方法及裝置,用以改善現有技術中雖然能對特效字體進行識別,但識別精度無法達到預期效果的問題。
本發明的實施例是這樣實現的:
第一方面,本申請實施例提供一種特效字體識別方法,其包括如下步驟:步驟S110:獲取待識別特效字體。步驟S120:分別將待識別特效字體和預設文字模板等分為預設數量個區域,并對區域進行編號,其中,位于相同位置的兩個區域的編號一致。步驟S130:利用SIFT特征算子同時對待識別特效字體和預設文字模板進行表征后,分別利用歐式距離計算編號一致的兩個區域的相似度,統計編號一致的兩個區域的相似度大于預設值的數目,若統計的數目未達到第一預設數目,則判定待識別特效字體為非模板類別文字,否則,執行步驟S140。步驟S140:利用空洞率為第一預置值的卷積核對待識別特效字體和預設文字模板進行處理后,分別利用歐式距離計算編號一致的兩個區域的相似度,統計編號一致的兩個區域的相似度大于預設值的數目,若統計的數目未達到第二預設數目,則判定待識別特效字體為非模板類別文字,否則,依次增加第一預置值的數值對待識別特效字體進行判斷,當增加后的第一預置值等于第二預置值時,執行步驟S150。步驟S150:若兩個區域相似的數量未達到第三預設數目,則判定待識別特效字體為非模板類別文字,若兩個區域相似的數量達到第三預設數目,則判定待識別特效字體為模板類別文字。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京惠朗時代科技有限公司,未經北京惠朗時代科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111509028.4/2.html,轉載請聲明來源鉆瓜專利網。





