[發(fā)明專利]一種基于支持向量幾何意義的增量學(xué)習(xí)方法有效
| 申請?zhí)枺?/td> | 201310585817.5 | 申請日: | 2013-11-20 |
| 公開(公告)號: | CN103605631A | 公開(公告)日: | 2014-02-26 |
| 發(fā)明(設(shè)計)人: | 張笑欽;王迪;樊明宇 | 申請(專利權(quán))人: | 溫州大學(xué) |
| 主分類號: | G06F15/18 | 分類號: | G06F15/18;G06K9/62 |
| 代理公司: | 北京中北知識產(chǎn)權(quán)代理有限公司 11253 | 代理人: | 程春生 |
| 地址: | 325000*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 支持 向量 幾何 意義 增量 學(xué)習(xí)方法 | ||
1.一種基于支持向量幾何意義的增量學(xué)習(xí)方法,其特征在于包括以下步驟:
(1)、提出有效的選取給定個數(shù)凸包頂點樣本的方法,我們稱為CHVS方法,并從理論上證明了此方法能夠選取到凸包頂點樣本;
(2)、通過運用CHVS方法,從大數(shù)據(jù)量訓(xùn)練樣本中選取出那些能夠最大程度地保持各類凸包信息的重要樣本,稱為VS方法;
(3)、用這些選取的少量重要樣本與新來的樣本一起重新訓(xùn)練得到更新的分類器;
(4)、步驟(2)和(3)重復(fù)迭代,直到?jīng)]有新的樣本到來為止。
2.根據(jù)權(quán)利要求1所述的基于支持向量幾何意義的增量學(xué)習(xí)方法,其特征在于:所述的步驟(1)包括以下子不步驟:
首先,用貪婪的方法選取出d+1個凸包頂點樣本,使得它們所組成的d-單純形是所有由訓(xùn)練樣本中任意d+1個樣本組成的d-單純形中體積近似最大的一個,所述的d是樣本的維數(shù);
其次,根據(jù)上一步所選取的d+1個凸包頂點樣本,將大數(shù)據(jù)量的樣本集合分成若干區(qū)域,使得在每一區(qū)域的樣本個數(shù)均不超過一個給定的閾值整數(shù);
最后,計算各個區(qū)域上的樣本到此區(qū)域子凸包的距離,將距離最大的那個樣本加入到當(dāng)前的凸包頂點樣本集合中,同時更新此樣本所在區(qū)域的子凸包;迭代直到選取的凸包頂點樣本個數(shù)達(dá)到給定數(shù)目為止。
3.根據(jù)權(quán)利要去1所述的基于支持向量幾何意義的增量學(xué)習(xí)方法,其特征在于:所述的步驟(2)包括以下子步驟:
首先,初始化所需要選取的凸包頂點樣本占總樣本的比例;
其次,利用CHVS方法按照此比例在各類樣本集中分別選取凸包頂點樣本,用這些樣本來訓(xùn)練SVM分類器,并計算分類器在測試樣本集上的正確率;
再次,根據(jù)正確率來判斷當(dāng)前所選取的樣本是否能夠最大程度地保持各類訓(xùn)練樣本集的凸包信息;如果不是,增加所需要選取樣本的比例,返回步驟(2)的第二步驟;
如果能夠最大程度地保持各類訓(xùn)練樣本集的凸包信息,最后,輸出所選取的能夠最大程度地保持凸包信息的重要樣本子集。
4.根據(jù)權(quán)利要去1所述的基于支持向量幾何意義的增量學(xué)習(xí)方法,其特征在于:所述的步驟(3)包括以下子步驟:
首先,初始化當(dāng)前訓(xùn)練樣本集為已存在的所有訓(xùn)練樣本;
其次,利用步驟(2)在當(dāng)前訓(xùn)練樣本集中選出那些能夠最大程度地保持凸包信息的樣本作為當(dāng)前訓(xùn)練樣本,并用這些樣本訓(xùn)練SVM分類器;
再次,若有新來樣本,則計算其到當(dāng)前分類器超平面的距離,如果距離小于某個閾值,就將此樣本加入當(dāng)前訓(xùn)練樣本集中,進(jìn)行重新訓(xùn)練,實現(xiàn)分類器的更新;否則,分類器不更新;最后,判斷當(dāng)前訓(xùn)練樣本集中個數(shù)是否超過給定閾值,如果是,返回第二步,否則,返回第三步。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于溫州大學(xué),未經(jīng)溫州大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310585817.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F15-00 通用數(shù)字計算機(jī)
G06F15-02 .通過鍵盤輸入的手動操作,以及應(yīng)用機(jī)內(nèi)程序的計算,例如,袖珍計算器
G06F15-04 .在引入被處理的數(shù)據(jù)的同時,進(jìn)行編制程序的,例如,在同一記錄載體上
G06F15-08 .應(yīng)用插接板編制程序的
G06F15-16 .兩個或多個數(shù)字計算機(jī)的組合,其中每臺至少具有一個運算器、一個程序器及一個寄存器,例如,用于數(shù)個程序的同時處理
G06F15-18 .其中,根據(jù)計算機(jī)本身在一個完整的運行期間內(nèi)所取得的經(jīng)驗來改變程序的;學(xué)習(xí)機(jī)器





