[發明專利]一種面向大規模數據集的相關向量機分類方法有效
| 申請號: | 201710225520.6 | 申請日: | 2017-04-07 |
| 公開(公告)號: | CN107103332B | 公開(公告)日: | 2018-06-26 |
| 發明(設計)人: | 劉芳;鐘昊;李思瀚;童蜜;秦王晨;趙斐 | 申請(專利權)人: | 武漢理工大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 湖北武漢永嘉專利代理有限公司 42102 | 代理人: | 李丹 |
| 地址: | 430070 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 大規模數據集 弱分類器 向量機分類 向量機 子節點 分布式計算平臺 獲取方式 集成學習 結合集成 模型訓練 性能降低 運行過程 組合策略 最終模型 不均衡 大數據 分類 準確率 集群 改進 保證 學習 | ||
1.一種面向大規模數據集的相關向量機分類方法,其特征在于,該方法包括以下幾個步驟:
1)數據采集:通過傳感器對被測對象進行實時檢測,采集被測對象的在不同工作狀態下的數據;所述被測對象的工作狀態包括正常工作狀態和異常工作狀態,工作狀態根據分類需求劃分;
2)獲取樣本集:對采集的數據進行樣本提取,得到總體樣本集并存儲在數據存儲模塊上;
3)在Spark分布式平臺下將總體樣本集切分成若干等份,將切分后的樣本集分配到集群子節點上,對樣本的權值進行初始化,同時所有子節點共享一個提升樣本數據集,用于提升訓練;
4)在集群子節點上對樣本集每一維進行訓練得到若干個RVM弱分類器;
5)得到弱分類器后對共享的提升訓練數據集進行測試,并將得到的結果返回至父節點,父節點中給提升訓練集樣本分配相同權值;
6)以相同數據集得到的若干個弱分類器為一組進行迭代運算,計算每一組弱分類器的帶權誤差;所述相同數據集是指步驟3)中切分后的樣本集中的同一樣本集;
7)選擇一組訓練子集所得的弱分類器對帶權誤差進行比較,選取每一組弱分類器中帶權值誤差最小的分類器,并計算該分類器對應的置信度;
8)對樣本權值進行更新,選擇另外一組訓練子集所得的弱分類器為一組,再重復步驟6)和7)中操作選取帶權值誤差最小的分類器,循環迭代一次進行一次權值更新,直至所有訓練子集選擇完畢結束迭代;
9)根據步驟8)中所選取的弱分類器進行組合,得到被測對象工作狀態的最終分類器,根據分類器結果對被測對象工作情況進行判斷。
2.根據權利要求1所述的面向大規模數據集的相關向量機分類方法,其特征在于,所述步驟1)中,數據采集過程具體如下:
采用數據采集傳感器對被測對象進行實時檢測,被測對象需設置在工作正常和工作異常兩種工作狀態檢測,數據采集傳感器將檢測所得的傳感信號轉為數值數據,同步傳送至數據邏輯模塊,相應獲得被測對象的兩組不同工作狀態下的相關數據;兩組數據的組成是被測對象在不同采樣時刻以一定的采樣頻率所檢測到的大量數據集。
3.根據權利要求1所述的面向大規模數據集的相關向量機分類方法,其特征在于,所述步驟2)中,樣本集的獲取過程具體如下:
2.1)特征分類:數據邏輯模塊接收到來自數據采集模塊的數據后,提取出能代表并區別該檢測數據的一組特征參數,且該組特征參數包括W個特征量,并對特征向量進行編號;
2.2)樣本集獲取:經特征提取后的數據按檢測時間組成樣本,一條樣本中包含相同檢測時間下的W個特征量;樣本數據集由訓練樣本、提升樣本和測試樣本以設定比例組成,對樣本中工作正常狀態下的樣本和工作異常狀態下的樣本數量根據實際需要按設定比例調配。
4.根據權利要求1所述的面向大規模數據集的相關向量機分類方法,其特征在于,所述步驟3)中,樣本xi初始化權值采用以下公式
D1(xi)=1/N,i=1,2,3...N
其中N為樣本的總數量,i為樣本集的索引號。
5.根據權利要求1所述的面向大規模數據集的相關向量機分類方法,其特征在于,所述步驟3)中,若存在對數據不均衡的數據集,采用Smote算法生成若干個少數類別的新樣本得到一個新的樣本集。
6.根據權利要求5所述的面向大規模數據集的相關向量機分類方法,其特征在于,對于數據不均衡的數據集使用Smote算法生成新樣本而得到新樣本集方法如下:
步驟3.1)對于該類數據集中的每一個樣本x,以歐氏距離為標準計算它到樣本集中所有樣本的距離,得到其k近鄰;
步驟3.2)根據樣本不平衡比例設置一個采樣比例以確定采樣倍率;
步驟3.3)對于每一個該類數據集中樣本,從其k近鄰中隨機選擇若干個樣本,假設選擇的近鄰為xk,分別與原樣本x按照以下公式構建新的樣本xnew;
xnew=x+rand(0,1)×(xk-x)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢理工大學,未經武漢理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710225520.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:照明裝置及顯示裝置
- 下一篇:云臺智能攝像頭(蛋形)





