[發明專利]一種基于隨機蕨分類器的半自主在線學習方法有效
| 申請號: | 201410317479.1 | 申請日: | 2014-07-04 |
| 公開(公告)號: | CN104063713B | 公開(公告)日: | 2017-11-17 |
| 發明(設計)人: | 羅大鵬;韓家寶;魏龍生;王勇;馬麗 | 申請(專利權)人: | 中國地質大學(武漢) |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 湖北武漢永嘉專利代理有限公司42102 | 代理人: | 王丹 |
| 地址: | 430074 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 隨機 分類 自主 在線 學習方法 | ||
技術領域
本發明屬于模式識別方法,具體涉及一種通過在線學習算法訓練分類器,以提高分類器性能的方法。
背景技術
在線學習屬于增量學習的研究范疇,在這一類方法中分類器對每個樣本只學一次,而不是重復的學習,這樣在線學習算法運行過程中不需要大量的存儲空間來存儲訓練樣本,分類器每獲得一個樣本,即對其進行在線學習,通過在線學習使分類器在使用過程中仍然能根據新樣本自我更新和改進,進一步提高分類效果。
早期的在線學習算法有Winnow算法,統一線性預測算法等,2001年學者Oza將這些算法與boosting算法進行結合,提出了在線boosting算法(該算法引自“Online bagging and boosting”N.Oza and S.Russell,In Proc.Artificial Intelligence and Statistics,105-112,2001),在Oza的方法中,強分類器是一定數量的弱分類器的加權和,這些弱分類器都是從弱分類器集合中挑選出來的。在線學習時,每個訓練樣本逐一的更新弱分類器集合中的每個弱分類器,包括調整正負樣本的分類閾值以及該分類器的權重,使好的弱分類器權重越來越高,而較差的弱分類器權重越來越低,從而每次在線學習一個樣本就可以挑選出一個當前權重最高的弱分類器加入強分類器中使最終訓練出來的分類器有較強的分類能力。但是,在線boosting算法的弱分類器集合中每個弱分類器都要對新樣本進行在線學習,當弱分類器個數較多時,在線學習速度必然會變慢。Grabner對在線boosting算法進行了改進,使其也象Adaboost算法一樣可以進行特征選擇,并且這種特征選擇以及對分類器的更新都是在線進行的,稱為在線Adaboost(該算法引自“On-line boosting and vision”H.Grabner and H.Bischof,In Proc.CVPR,(1):260-267,2006)。但是在線Adaboost用特征選擇算子代替一般的弱分類器合成強分類器,特征選擇算子數以及特征選擇算子對應的弱分類器數都是固定的,相應的在線學習分類器結構比較僵化。當發現其分類能力無法滿足檢測性能的要求時,即使持續的在線學習下去也無法提高檢測精度。
發明內容
本發明要解決的技術問題是:提供一種基于隨機蕨分類器的半自主在線學習方法,能夠提高分類性能。
本發明為解決上述技術問題所采取的技術方案為:一種基于隨機蕨分類器的半自主在線學習方法,其特征在于:它包括以下步驟:
1)準備初始訓練分類器的樣本集:
針對待檢測目標類,在視頻圖像的第一幀中框選出一個目標,對該目標圖片進行仿射變換得到的圖片作為正樣本;以不含有目標的背景圖像區域作為負樣本;如此隨機的獲取一定數量的正樣本和負樣本作為初始訓練分類器的樣本集;
2)隨機蕨分類器初始訓練:
使用準備好的初始訓練分類器的樣本集對隨機蕨分類器進行初始訓練,初始訓練好的隨機蕨分類器即為當前目標檢測器,遍歷待檢測的視頻圖像進行目標檢測;
3)獲得在線學習樣本:
對于步驟2)中得到的檢測后的視頻圖像,采用人工判斷其檢測結果的正確性,對于正確的檢測結果人工標注為正樣本,否則為負樣本,對漏檢的視頻圖像標注為正樣本;判斷后的正負樣本為在線學習樣本;
4)隨機蕨分類器的在線訓練:
使用步驟3)獲得的正負樣本對隨機蕨分類器進行在線學習,逐漸提高其分類精度。
按上述方法,步驟2)的具體方法如下:
2.1)構造隨機蕨:
對樣本集中的單個樣本上隨機取s對特征點作為一組隨機蕨,每個樣本取特征點的位置相同,每對特征點進行像素值的比較,每對特征點中前一個特征點像素值大則取特征值為1,反之則取特征值為0,s對特征點比較后得到的s個特征值按照隨機的順序構成一個s位的二進制數,即為該組隨機蕨的隨機蕨數值,每個樣本的隨機蕨中特征值的順序一致;
2.2)計算隨機蕨數值在正負樣本類上的后驗概率:
隨機蕨中,有一部分為正樣本得到的,其它為負樣本得到的;隨機蕨數值的取值種類有2s個;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國地質大學(武漢),未經中國地質大學(武漢)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410317479.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:網絡切換過程中通話數據同步的方法及系統
- 下一篇:數據處理的方法和裝置





