[發(fā)明專利]一種用于支持向量機的在線向量選取方法在審
| 申請?zhí)枺?/td> | 201310186771.X | 申請日: | 2013-05-20 |
| 公開(公告)號: | CN103279761A | 公開(公告)日: | 2013-09-04 |
| 發(fā)明(設(shè)計)人: | 沈海斌;劉健;吳翔 | 申請(專利權(quán))人: | 浙江大學(xué) |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 杭州求是專利事務(wù)所有限公司 33200 | 代理人: | 杜軍 |
| 地址: | 310027 浙*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用于 支持 向量 在線 選取 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及在線向量的選取方法,應(yīng)用于支持向量機在線學(xué)習(xí)前的訓(xùn)練在線向量的選取。
背景技術(shù)
在機器學(xué)習(xí)中,支持向量機由于能夠高效地解決非線性樣本的分類而得到了廣泛的應(yīng)用。很多時候,支持向量機的分類模型并不是一次性就能夠完成訓(xùn)練的,其訓(xùn)練向量會隨著時間增加而不斷增加新的訓(xùn)練樣本,我們通常把新增訓(xùn)練樣本向量稱為在線向量。對于支持向量機來說,并不是所有的在線向量都對分類模型的求解都具有同樣重要的意義,實際上很多向量除了提高訓(xùn)練的時間并沒有影響分類模型的求解。對于機器學(xué)習(xí)的應(yīng)用而言,減少訓(xùn)練時間并保證訓(xùn)練精度是重要的性能要求。因此,在線向量的選取方法就具有重要的作用
常用的在線學(xué)習(xí)向量處理方法,是通過時間窗口進行挑選,就是對于在線向量集合按加入的時間順序進行排序。此后,隨著在線向量的增加,不斷的去除最早加入的樣本向量,加入新的樣本向量,形成更新后的在線向量樣本集合。
而在在線學(xué)習(xí)的應(yīng)用中,這種簡單的在線學(xué)習(xí)向量處理方法,只是機械式的選取在線向量,沒有依據(jù)樣本對支持向量機分類模型的重要性進行排序,所以選取的在線向量集合對于支持向量機的分類正確率沒有保證。為了提高性能,需要有新的選取方法來解決問題。
因此,支持向量機的在線向量選取還有很多改進之處。
發(fā)明內(nèi)容
本發(fā)明針對現(xiàn)有技術(shù)的不足,提供了一種用于支持向量機的在線向量選取方法。
本發(fā)明求解向量空間邊界向量,對邊界向量進行對比,記錄支持向量機判斷錯誤的邊界向量,原支持向量與判斷錯誤的支持向量合并為新的訓(xùn)練向量,具體是:
(1)當(dāng)獲得新的訓(xùn)練向量時,對向量集合進行計算求解邊界向量。
(2)對得到的邊界向量與原支持向量進行對比,去除與支持向量重合的邊界向量。
(3)將處理后的邊界向量通過支持向量機判斷,保留判斷錯誤的邊界向量集合。
(4)將保留的邊界向量與原支持向量合并就獲得最終用于支持向量機訓(xùn)練的訓(xùn)練向量。
?本發(fā)明能大幅度的減少訓(xùn)練向量的數(shù)量,因此減少支持向量機的訓(xùn)練時間,并且不會影響支持向量機的分類精度。
具體實施方式
下面詳細說明本發(fā)明的步驟組成:求解向量空間邊界向量,對邊界向量進行對比,記錄支持向量機判斷錯誤的邊界向量,原支持向量與判斷錯誤的支持向量合并為新的訓(xùn)練向量。具體的實現(xiàn)過程如下。
(1)向量空間邊界向量求解算法:
1、將含給定訓(xùn)練向量集???????????????????????????????????????????????在內(nèi)的最小超球面上的點集初始設(shè)為,即:是訓(xùn)練向量集在最小超球面上的映射。
2、根據(jù)到超球中心的距離,對訓(xùn)練向量集進行降序處理排列得?,即表示經(jīng)過排序后的訓(xùn)練向量集。
3、當(dāng)有新的訓(xùn)練向量加入時,依照原超球的中心坐標(biāo),計算其到超球的中心距離,并更新原來的。
4、當(dāng)新的訓(xùn)練向量超過的范圍時,重新迭代計算超球的中心坐標(biāo)??傊鴺?biāo)中的前五分之一的部分向量就是所求的邊界向量。
(2)對邊界向量進行對比
將所求解的邊界向量集合與原支持向量集合進行對比,由于兩種集合可能存在重合的向量,因此在邊界向量集合中刪除與支持向量重合的部分,僅保留未重合的邊界向量集。
(3)記錄支持向量機判斷錯誤的邊界向量
將上述處理后得到的邊界向量利用已經(jīng)訓(xùn)練好的支持向量機進行分類判斷,記錄下支持向量機分類器判斷錯誤的邊界向量集合。
(4)合并為新的訓(xùn)練向量
將上述判斷失誤的邊界向量集合與原支持向量合并,就構(gòu)成了新的在線向量集合。至此,就完成了在線向量集合的選取。
以上所述僅為本發(fā)明的具體實施方式,并不用以限制本發(fā)明,任何本發(fā)明所屬領(lǐng)域內(nèi)的技術(shù)人員,在本發(fā)明揭露的技術(shù)范圍內(nèi),所作的修改或替換,都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學(xué),未經(jīng)浙江大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310186771.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 用于呈現(xiàn)在線實體在線狀態(tài)的系統(tǒng)和方法
- 提供web服務(wù)接入的在線系統(tǒng)和方法
- 定制在線圖標(biāo)
- 一種水質(zhì)在線檢測預(yù)處理裝置
- 在線測試學(xué)習(xí)方法、系統(tǒng)、計算機設(shè)備及存儲介質(zhì)
- 一種在線文檔的分頁方法、裝置、設(shè)備以及可讀介質(zhì)
- 一種基于web在線學(xué)習(xí)的資源訪問平臺
- 一種在線學(xué)習(xí)系統(tǒng)
- 在線文檔提交方法、裝置、計算機設(shè)備和存儲介質(zhì)
- 空調(diào)冷媒量確定方法、系統(tǒng)和可讀存儲介質(zhì)





