[發明專利]復雜干擾下字符串的分割與識別方法無效
| 申請號: | 201210193246.6 | 申請日: | 2012-06-13 |
| 公開(公告)號: | CN102722736A | 公開(公告)日: | 2012-10-10 |
| 發明(設計)人: | 汪榮貴;戴經成;周良;李想;游生福;查煒 | 申請(專利權)人: | 合肥工業大學 |
| 主分類號: | G06K9/66 | 分類號: | G06K9/66;G06K9/34 |
| 代理公司: | 安徽省合肥新安專利代理有限責任公司 34101 | 代理人: | 何梅生 |
| 地址: | 230009 *** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 復雜 干擾 字符串 分割 識別 方法 | ||
1.一種復雜干擾下字符串的分割與識別方法,其特征按如下過程進行:
Ⅰ、學習階段:利用多示例機器學習的方法按如下步驟對復雜干擾下字符串進行學習;
步驟1、獲取多示例學習的各個包;
將包含有干擾的m個字符圖像切分成m份圖片;每一份圖片包含且僅包含一個完整的字符;將所述m份圖片作為多示例學習的m個包,以所述m個包分別入庫;所述分別入庫是指將同一字符作為同一類,放入在同一個文件夾中,獲得與類的數量相一致的n個文件夾,所述n不大于m;
步驟2、利用haar-like特征原型提取haar-like特征作為包的示例;
若所述圖像不是灰度圖像,則先將庫內的每一個包進行灰度化處理,再按式(1)計算包的積分圖;若所述圖像是灰度圖像,則利用式(1)計算包的積分圖ii:
式(1)中ii(x,y)表示圖像中橫坐標i≤x,縱坐標j≤y的所有像素之和;
采用haar-like特征原型在所述包的積分圖中提取haar-like特征作為包的示例;所述包的示例由向量表示,所述向量的每一個分量對應每一個haar-like特征原型所提取的特征值;
步驟3、利用多樣性密度算法找到庫中每一類的多樣性密度最大的前u個包的示例作為該類的關鍵示例;
步驟4、將每一類的關鍵示例作為SVM分類器樣本進行分類;按照類的個數n訓練出n個SVM分類器,將所述n個SVM分類器構造成一棵二叉決策樹,每個SVM分類器為所述二叉決策樹的每個節點;所述每個SVM分類器按如下方法獲得;
將庫中某一類的關鍵示例作為SVM分類器學習的正樣本:從庫中其它類中的所有關鍵示例中任意選取u個關鍵示例,作為SVM分類器學習的負樣本:以所述正樣本和負樣本通過SVM算法訓練得到式(7)所表征的SVM分類器f(t):
f(t)=sgn(<W*,t>+b*)????(2)
式(2)中,b*為設定的閾值,t為待分類的學習樣本,W*為權重向量;
Ⅱ、識別階段:利用所述多示例機器學習方法獲得的SVM分類器f(t)對復雜干擾下字符串進行識別;
以最小的字符大小作為初始掃描矩形特征窗口,自左至右、再自上而下,掃描圖像經切分后的每個圖片;計算掃描窗口內的矩形特征值,得到特征向量T,將所述特征向量T從所述二叉決策樹頂端按照從上到下的順序代入每個節點,利用式(3)計算獲得f(T):
f(T)=sgn(<W*,T>+b*)????(3)
直到f(T)大于0時,分類結束,輸出識別結果;若特征向量T帶入所述二叉決策樹的最后一個節點計算后,f(T)仍小于0,則將所述初始掃描矩形特征窗口以固定倍率擴大后,再帶入所述二叉決策樹頂端的每個節點進行計算,直至f(T)>0,則分類結束,輸出識別結果,若所述初始掃描矩形特征窗口的大小擴大到大于最大字符時,仍然未找到f(T)>0,則表示識別失敗。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥工業大學,未經合肥工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210193246.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:半導體電容器的形成方法
- 下一篇:帶驅動突緣的切割帶





