[發明專利]一種基于k均值樣本預選的支持向量機主動學習方法在審
| 申請號: | 201710306162.1 | 申請日: | 2017-05-04 |
| 公開(公告)號: | CN107145907A | 公開(公告)日: | 2017-09-08 |
| 發明(設計)人: | 楊云;任皓;何臻力 | 申請(專利權)人: | 云南大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京科億知識產權代理事務所(普通合伙)11350 | 代理人: | 湯東鳳 |
| 地址: | 650091 云*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 均值 樣本 預選 支持 向量 機主 學習方法 | ||
1.一種基于k均值樣本預選的支持向量機主動學習方法,其特征在于,所述基于k均值樣本預選的支持向量機主動學習方法包括以下步驟:
步驟一,利用k均值聚類算法進行樣本預選,基于距離選擇出少部分靠近聚類中心、較為密集、“重要”的樣本來代替整個樣本集進行常規支持向量機的訓練;
步驟二,依據數據預選的結果,在未標記實例集中對重要樣本集L*中的每個實例進行查詢,將查詢得到的類標返回;得到未標記實例集中的部分“重要”實例并獲取標記,來代替全部未標記實例;
步驟三,利用樣本預選結果,重要樣本集L*作為支持向量機主動學習的訓練集,結合傳統的SVM方法進行模型訓練,得到最終的學習模型。
2.如權利要求1所述的基于k均值樣本預選的支持向量機主動學習方法,其特征在于,所述K均值聚類算法包括:
給定樣本集D={x1,x2,;;;,xm},“k均值”算法針對聚類所得簇劃分C={c1,c2,;;;,ck}最小化平方誤差:
其中,x是簇ci的均值向量;生成的聚類個數K=2。
3.如權利要求1所述的基于k均值樣本預選的支持向量機主動學習方法,其特征在于,所述學習模型驗證的方法包括:
算法1;Active SVM;
4.一種如權利要求1所述基于k均值樣本預選的支持向量機主動學習方法的基于k均值樣本預選的支持向量機主動學習系統,其特征在于,所述基于k均值樣本預選的支持向量機主動學習系統包括:
樣本預選模塊,用于利用k均值聚類算法進行樣本預選,基于距離選擇出少部分靠近聚類中心、較為密集、“重要”的樣本來代替整個樣本集進行常規支持向量機的訓練;
標記查詢模塊,用于依據數據預選的結果,在未標記實例集中對重要樣本集L*中的每個實例進行查詢,將查詢得到的類標返回;
SVM模型生成模塊,用于利用樣本預選結果,重要樣本集L*作為支持向量機主動學習的訓練集,結合傳統的SVM方法進行模型訓練,得到最終的學習模型。
5.一種利用權利要求1~3任意一項所述基于k均值樣本預選的支持向量機主動學習方法的基于距離聚類的樣本預選方法,其特征在于,所述基于距離聚類的樣本預選方法利用基于距離的聚類算法獲得整合成員變量的主動學習方法所需的假設空間,得到重要樣本集進行類標查詢、SVM模型生成。
6.一種利用權利要求1~3任意一項所述基于k均值樣本預選的支持向量機主動學習方法的基于密度聚類的樣本預選方法,其特征在于,所述基于密度聚類的樣本預選方法鄰近區域的密度、對象或數據點的數目超過某個閾值,繼續聚類;對給定類中的每個數據點,在一個給定范圍的區域內必須至少包含某個數目的點。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于云南大學,未經云南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710306162.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種網絡攝像機
- 下一篇:非接觸式滾柱超越離合器





