[發明專利]一種存在模糊態的字輪圖像數字識別方法有效
| 申請號: | 202010885555.4 | 申請日: | 2020-08-28 |
| 公開(公告)號: | CN111814917B | 公開(公告)日: | 2020-11-24 |
| 發明(設計)人: | 朱煉;趙勇;常關羽;牛富增;賈忠友 | 申請(專利權)人: | 成都千嘉科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京市領專知識產權代理有限公司 11590 | 代理人: | 張玲;葛紅 |
| 地址: | 610211 四川省成都*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 存在 模糊 圖像 數字 識別 方法 | ||
本發明涉及一種存在模糊態的字輪圖像數字識別方法,具體包括以下步驟:獲取狀態提取器的訓練集,以及獲取分類器的訓練集;使用狀態提取器的訓練集對狀態提取器進行訓練,使用分類器的訓練集對分類器進行訓練;將待識別樣本輸入訓練后的狀態提取器,得到狀態變量,將狀態變量輸入訓練后的分類器,輸出分類結果。本發明對連續變化的圖像或沒有明確分類界限的圖像進行有效的識別處理,比如字輪圖像數字的識別,使用構造的狀態提取器對待識別樣本的特征狀態進行提取,得到狀態變量,根據狀態變量經隸屬函數后得到的隸屬度,將待識別樣本送入隸屬度相應的分類器中,從而對待識別樣本進行正確的分類。
技術領域
本發明涉及圖像識別技術領域,特別涉及一種存在模糊態的字輪圖像數字識別方法。
背景技術
圖像信息的處理是當今技術的一種重要課題,近些年隨著深度學習方法的發展,對于圖像識別問題已經給出了較為成熟的解決方案,在車牌識別、文本識別等場景中取得了落地應用。
但目前學界研究的主要是具有明確分類界線的圖像識別問題,而實際場景中常存在著一些界線模糊的圖像分類問題。比如字輪圖像數字的識別是一種典型的界線模糊圖像分類問題,因為字輪轉動是一個連續的過程,既有可能出現字輪中完整字符的情況,比如如圖1所示出現的字符“5”為完整的字符,或者出現的字符“6”也是完整的字符,也可能出現半字符的情況,比如出現的字符“5”和字符“6”的中間狀態,更多的可能是介于完整字符與半字符之間的情況。可以將完整字符和半字符的情況稱為“確定狀態”,將介于完整字符和半字符之間的情況稱為“模糊態”。
在圖像識別的場景中,若忽略處于模糊態的數據,將會導致圖像識別模型無法準確有效的識別處于模糊態的圖像,也就難以推廣應用。若對處于模糊態的數據強行進行類別的劃分,又會造成模型在訓練過程中的迭代不收斂。因此,對于這些連續變化的場景或者沒有明確分類界線的圖像識別問題進行有效的處理,使得其能夠被分類,是圖像識別中非常重要的問題。
發明內容
本發明的目的在于對連續變化的圖像或沒有明確分類界限的圖像進行有效的識別處理,比如字輪圖像數字的識別,提供一種存在模糊態的字輪圖像數字識別方法。
為了實現上述發明目的,本發明實施例提供了以下技術方案:
一種存在模糊態的字輪圖像數字識別方法,具體包括以下步驟:
獲取狀態提取器的訓練集,以及獲取分類器的訓練集;
使用狀態提取器的訓練集對狀態提取器進行訓練,使用分類器的訓練集對分類器進行訓練;
將待識別樣本輸入訓練后的狀態提取器,得到狀態變量,將狀態變量輸入訓練后的分類器,輸出分類結果。
所述獲取狀態提取器的訓練集的步驟,包括:從數據集中篩選出確定狀態的數據,舍棄模糊態的數據,并對篩選出來的確定狀態的數據進行狀態標注,狀態標注后的數據形成確定狀態訓練集,作為狀態提取器的訓練集;所述狀態標注包括完整字符狀態標注、半字符狀態標注;
所述獲取分類器的訓練集的步驟,包括:對數據集中的所有數據進行分類標注,分類標注后的數據作為分類器的訓練集;所述分類標注包括字符標注。
所述使用狀態提取器的訓練集對狀態提取器進行訓練的步驟,包括:
預訓練狀態特征提取結構:使用確定狀態訓練集對狀態特征提取結構進行預訓練,得到狀態特征提取結構的參數;
特征度量學習:每次向狀態特征提取結構中隨機輸入兩個樣本以及這兩個樣本之間的距離,訓練以狀態特征提取結構為基礎的狀態提取器;
構造確定狀態的特征集:選取每個確定狀態訓練集中與同狀態其余樣本距離之和最小的一個樣本,作為該確定狀態的特征樣本,將該特征樣本添加到確定狀態的特征集中,直到確定狀態的特征集內存儲了代表N個確定狀態的N個特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都千嘉科技有限公司,未經成都千嘉科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010885555.4/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





