[發明專利]一種基于隨機蕨的自舉弱學習方法及其分類器有效
| 申請號: | 201210180065.X | 申請日: | 2012-06-04 |
| 公開(公告)號: | CN102708384A | 公開(公告)日: | 2012-10-03 |
| 發明(設計)人: | 權偉;陳錦雄;余南陽;劉彬 | 申請(專利權)人: | 西南交通大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 成都博通專利事務所 51208 | 代理人: | 林毓安 |
| 地址: | 610031 四*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 隨機 學習方法 及其 分類 | ||
技術領域
本發明屬于計算機圖形圖像模式識別技術領域,特別涉及機器學習,計算機視覺技術。
背景技術
隨著計算機技術的發展,研究復雜的信息處理過程成為可能。信息處理過程的一個重要形式就是模式識別,即主體對環境及客體的識別,而分類過程則是模式識別的基本任務。目前,Boosting自舉分類方法(這里主要指AdaBoost自適應自舉方法)因其在檢測和識別中的實際應用能力,在模式識別和機器學習任務中得到越來越廣泛的應用,如醫學圖像分析,光學文字識別,語音識別,手寫識別,人臉識別,指紋識別,虹膜識別,文件分類,攝影測量與遙感,互聯網搜索引擎,信用評分等。在Boosting自舉分類器的訓練過程中,不同的弱學習方法將決定Boosting自舉分類器的訓練速度,收斂性和準確率。弱學習方法主要基于特征的選擇和閾值的確定。
Leshem將AdaBoost算法應用到交通管理信息系統中,利用弱學習器來訓練道路交通數據,并且預測道路交通流量情況,取得良好的效果。Lin將RealAdaBoost算法應用到基于內容的圖像檢索系統中,通過對圖像的類別短語進行訓練,達到降低噪聲的效果,實驗表明比KNN(K-nearest?Neighbor)分類算法準確性有所提高。Dai等人將AdaBoost算法應用到區域圖像檢索中,通過使用AdaBoost弱分類器對特征反復訓練,得到具有較小錯分率的強分類器,從而返回更加精確的查詢結果。為了解決不同的特征融合分類問題,Yin等人提出了一種改進的boosting算法,使用一個弱分類器僅對某一個特征集進行訓練,最終根據權重將這些弱分類器組合成一個強分類器,該方法在手寫數字識別中取得了較好的效果。Viola等人提出了的樣本權重更新方法,被正確分類樣本權重減小,而錯誤分類樣本權重不變。AdaBoost在學習訓練的過程中要解決的是每一輪樣本訓練集的樣本分布問題,其中正負樣本的權重更新及錯分率的處理至關重要。對樣本進行兩類劃分,以便保證弱分類器分得的樣本準確率大于隨機猜測的準確率。李闖等人提出了針對目標檢測問題的改進AdaBoost算法,采用了新的參數求解方法,弱分類器的加權參數不但與錯分率有關,還與其對正樣本的識別能力有關。Kim等人提出了特征值是基于高斯概率分布的AdaBoost算法,通過特征值的分布與高斯概率分布的均值距離來判別正負樣本。謝紅躍等人提出一種AdaBoost樣本閾值和偏置計算方法,該方法依據樣本權重的大小計算出對應的樣本閾值,并用來區分正確分類和錯誤分類的樣本,從而使得弱分類器劃分準確性大于50%。鐘向陽等人提出基于多閾值弱學習的Adaboost檢測器,該方法采用分類樹作為弱學習器,以貪婪的方法用誤差測度減少最大化的劃分準則劃分節點,并由此生成弱分類器,然后采用RAB或GAB方法在給定數據和標簽的訓練集上將這些弱分類器提升為強分類器。但是,這些弱學習方法要么收斂速度慢,要么準確率不夠高,要么計算效率低。
鑒于以上方法的不足,本發明提出基于隨機蕨的自舉弱學習方法,該方法收斂速度快,計算效率高,且最終得到的自舉分類器準確率高。本發明方法采用的圖像特征融合局部二元模式特征(LBP)和類哈爾特征(haar-like),對對象局部區域進行測量并編碼;然后,將樣例對應的特征值作為隨機蕨的樣本輸入,隨機蕨對所有編碼進行計數;接著,根據隨機蕨記錄的樣本分布,選擇最好的編碼作為該特征對應的判別特征值(閾值);最后,將得到的基于這種特征值編碼的隨機蕨弱分類器作為預測函數加入到自舉算法框架中,其余處理過程與自適應自舉算法一致,最終得到一個強分類器。因此,本發明方法可以很好地解決成像環境復雜且對運算量要求嚴格的圖像模式識別問題。此外,本發明方法同時適合于離線和在線自舉分類器訓練。
發明內容
本發明的目的是提供一種基于隨機蕨的自舉弱學習方法及其分類器,它能實現快速收斂和高效的自舉弱學習方法,得到實時處理且準確率高的分類器。
本發明實現是發明目的所采用的技術方案是:一種基于隨機蕨的自舉弱學習方法及其分類器,所述方法包括如下內容:
(1)選擇圖像特征和構造隨機蕨
采用的圖像特征融合局部二元模式特征(LBP)和類哈爾特征(haar-like),這些特征對圖像區域的梯度方向進行測量,并量化輸出8種可能的編碼,如圖1、圖2和圖3所示,它們均為矩形特征。具體來說,先分別按照水平方向,垂直方向和對角方向將矩形區域平分為兩部分,分別標記為白色和黑色,然后,計算白色矩形像素值的和減去黑色矩形像素值的和,該值如果大于0,則編碼為1,否則為0。因此,對于一個特征,3個方向得到3位的二進制編碼,即23=8種可能的值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西南交通大學,未經西南交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210180065.X/2.html,轉載請聲明來源鉆瓜專利網。





