[發明專利]一種回溯式迭代車輛性能極度不平衡數據分類方法在審
| 申請號: | 202110939593.8 | 申請日: | 2021-08-16 |
| 公開(公告)號: | CN113657489A | 公開(公告)日: | 2021-11-16 |
| 發明(設計)人: | 楊云;左鵬飛;倪園園;劉晨;段宗濤;康軍 | 申請(專利權)人: | 長安大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 馬貴香 |
| 地址: | 710064*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 回溯 式迭代 車輛 性能 極度 不平衡 數據 分類 方法 | ||
1.一種回溯式迭代車輛性能極度不平衡數據分類方法,其特征在于,包括以下步驟:
步驟1,從車輛性能測評數據獲取多個訓練樣本,初始化所有訓練樣本的權重;
步驟2,通過回溯式迭代更新所有訓練樣本的權重:每次迭代中,根據所屬迭代次數對應的訓練樣本權重構建與迭代次數對應的弱分類器,采用弱分類器對訓練樣本進行分類,根據弱分類器所得的分類結果更新所有訓練樣本的權重,再基于綜合相似度和KNN分類算法回溯更新所有訓練樣本的權重,回溯更新完成后,進行下一次迭代;其中,所述綜合相似度是指根據相似度理論和歐幾里得距離綜合判斷的相似度;
步驟3,組合步驟2)中得到的所有弱分類器,獲得強分類器;
步驟4,采用強分類器對待分類的測試樣本進行分類。
2.根據權利要求1所述的回溯式迭代車輛性能極度不平衡數據分類方法,其特征在于,基于綜合相似度和KNN分類算法回溯更新所有樣本的權重,具體是:通過KNN分類算法從所有訓練樣本中選取與被錯分為正樣本的負樣本綜合相似度最大的K個正樣本,并從K個正樣本中提取正確分類的正樣本來動態調整K值,以最大程度地降低綜合相似度較大且被正確分類的正樣本權重,最小程度地降低綜合相似度較低且被正確分類的正樣本的權重。
3.根據權利要求1所述的回溯式迭代車輛性能極度不平衡數據分類方法,其特征在于,步驟1中,所有訓練樣本組成數據集為S={(x1,y1),(x2,y2),…,(xN,yN)},每一個訓練樣本xi=(xi1,…xim,…,xiM)∈RM,RM為訓練樣本中特征向量的集合,樣本標簽yi∈Y={-1,+1},其中,i=1,2,…,N,m=1,2,…,M;N為訓練樣本的數量,M為每個訓練樣本的特征數目;初始化數據集中所有訓練樣本的權重W1:
。
4.根據權利要求3所述的回溯式迭代車輛性能極度不平衡數據分類方法,其特征在于,步驟2中,根據弱分類器所得的分類結果更新所有訓練樣本的權重,具體為:根據弱分類器所得的分類結果計算分類誤差,根據分類誤差計算學習率,根據學習率來更新所有訓練樣本的權重。
5.根據權利要求4所述的回溯式迭代車輛性能極度不平衡數據分類方法,其特征在于,步驟2中,根據弱分類器所得的分類結果更新所有訓練樣本的權重,具體過程如下:
步驟2.1.1,對迭代次數t,根據權重Wt構建與迭代次數對應弱分類器Gt(x):
Gt(x)={-1,+1}
步驟2.1.2,計算分類誤差et:
其中,P為加權概率,函數
步驟2.1.3,計算學習率αt:
步驟2.1.4,更新權重Wt:
Wt=(wt,1,…,wt,i,…,wt,N)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于長安大學,未經長安大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110939593.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種公路施工用降塵防污裝置
- 下一篇:一種車輛距離探測方法、系統、設備及介質





