[發(fā)明專利]一種基于改進K-means的駕駛行為分析方法在審
| 申請?zhí)枺?/td> | 202010198869.7 | 申請日: | 2020-03-19 |
| 公開(公告)號: | CN111461185A | 公開(公告)日: | 2020-07-28 |
| 發(fā)明(設計)人: | 吳艷霞;李儲巖;王旭;王青文 | 申請(專利權)人: | 哈爾濱工程大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q10/06 |
| 代理公司: | 哈爾濱市松花江專利商標事務所 23109 | 代理人: | 時起磊 |
| 地址: | 150001 黑龍江*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 改進 means 駕駛 行為 分析 方法 | ||
1.一種基于改進K-means的駕駛行為分析方法,其特征在于,該方法包括以下步驟:
步驟一、采集m名駕駛員駕駛行為的原始數(shù)據(jù),對采集的原始數(shù)據(jù)進行預處理,獲得預處理后數(shù)據(jù);
步驟二、從預處理后數(shù)據(jù)中提取出若干個特征參數(shù)值,再對提取出的特征參數(shù)值進行標準化處理,獲得標準化處理后的特征參數(shù)值;
步驟三、根據(jù)標準化處理后的特征參數(shù)值提取超速傾向行為因子P1和變速駕駛行為因子P2,并計算各特征參數(shù)值在因子P1上的得分系數(shù)以及各特征參數(shù)值在因子P2上的得分系數(shù);
根據(jù)各特征參數(shù)值在因子P1上的得分系數(shù)以及在因子P2上的得分系數(shù),計算出每名駕駛員在因子P1上的得分以及每名駕駛員在因子P2上的得分,對于駕駛員i,駕駛員i在因子P1上的得分表示為P1i,駕駛員i在因子P2上的得分表示為P2i;
步驟四、將駕駛員i的駕駛行為數(shù)據(jù)表示為Xi,Xi={P1i,P2i},則m名駕駛員的駕駛行為數(shù)據(jù)組成駕駛行為數(shù)據(jù)集D,D={X1,X2,…,Xm};
將每名駕駛員的駕駛行為數(shù)據(jù)作為數(shù)據(jù)集D的一個樣本點,即駕駛員i的駕駛行為數(shù)據(jù)為數(shù)據(jù)集D中的第i個樣本點;
步驟五、分別計算出數(shù)據(jù)集D中每個樣本點的密度;
步驟六、選取密度最大的樣本點作為第一個聚類中心c1,將數(shù)據(jù)集D中與c1距離小于meanDis(D)的樣本點,以及c1從數(shù)據(jù)集D中刪除,獲得新數(shù)據(jù)集D′,meanDis(D)代表數(shù)據(jù)集D中所有樣本點的平均差異度;
數(shù)據(jù)集D中與c1距離小于meanDis(D)的樣本點,以及c1組成第一個子集;
步驟七、分別計算出數(shù)據(jù)集D′中每個樣本點的密度ρ(i′)、每個樣本點的類中樣本之間的平均差異度a(i′)以及每個樣本點的簇間差異度b(i′);i′=1,2,…,n,n代表數(shù)據(jù)集D′中樣本點的個數(shù);
步驟八、將ρ(i′)、1/a(i′)和b(i′)的乘積定義為w,選取最大的w對應的樣本點作為第二個聚類中心c2,將數(shù)據(jù)集D′中與c2距離小于meanDis(D′)的樣本點,以及c2從數(shù)據(jù)集D′中刪除,獲得新數(shù)據(jù)集D″,meanDis(D′)代表數(shù)據(jù)集D′中所有樣本點的平均差異度;
數(shù)據(jù)集D′中與c2距離小于meanDis(D′)的樣本點,以及c2組成第二個子集;
步驟九、分別計算出數(shù)據(jù)集D″中每個樣本點與c1的距離以及每個樣本點與c2的距離,選取出max(w′(i″,c1)*w′(i″,c2))的樣本點i″,作為第三個聚類中心c3;將數(shù)據(jù)集D″中與c3距離小于meanDis(D″)的樣本點,以及c3從數(shù)據(jù)集D″中刪除,獲得新數(shù)據(jù)集D″′,meanDis(D″)代表數(shù)據(jù)集D″中所有樣本點的平均差異度;
其中:w′(i″,c1)代表數(shù)據(jù)集D″中的第i″樣本點與c1的距離,w′(i″,c2)代表數(shù)據(jù)集D″中的第i″樣本點與c2的距離,*代表做乘積;
數(shù)據(jù)集D″中與c3距離小于meanDis(D″)的樣本點,以及c3組成第三個子集;
步驟十、重復步驟九的過程,直至獲得的新數(shù)據(jù)集為空集,將數(shù)據(jù)集D分為若干個子集;
分別計算每個子集中包含的全部樣本點的均值,將獲得的均值作為初始中心;
步驟十一、對于數(shù)據(jù)集D中除了初始中心外的其他各個樣本點,分別計算其他各個樣本點與各個初始中心的距離,將其他各個樣本點分別添加到與其距離最小的初始中心所處的類中,即重新將數(shù)據(jù)集D分成若干個子集,每一個子集為一個聚類;
步驟十二、分別計算每一個聚類中包含的全部樣本點的平均距離,將計算出的平均距離作為對應聚類的新聚類中心;
步驟十三、將新聚類中心與初始中心進行比較,若新聚類中心與初始中心相比沒有變化,則輸出最終的聚類結果;
否則,新聚類中心與初始中心相比有變化,則將新聚類中心作為步驟十一中的初始中心,重復執(zhí)行步驟十一和步驟十二的過程,直至步驟十二獲得的新聚類中心與步驟十一的初始中心相比沒有變化時停止迭代,輸出最終的聚類結果;
步驟十四、根據(jù)輸出的聚類結果進行駕駛行為的分析。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工程大學,未經(jīng)哈爾濱工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010198869.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





