[發明專利]基于離群點分析算法的套牌車快速甄別方法在審
| 申請號: | 201610182562.1 | 申請日: | 2016-03-24 |
| 公開(公告)號: | CN105654735A | 公開(公告)日: | 2016-06-08 |
| 發明(設計)人: | 馬韻潔;劉暢;張凱;吳艷平;羅晶晶;朱萍 | 申請(專利權)人: | 安徽四創電子股份有限公司 |
| 主分類號: | G08G1/017 | 分類號: | G08G1/017 |
| 代理公司: | 合肥和瑞知識產權代理事務所(普通合伙) 34118 | 代理人: | 王挺;柯凱敏 |
| 地址: | 230088 安徽省合肥*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 離群 分析 算法 套牌車 快速 甄別 方法 | ||
1.一種基于離群點分析算法的套牌車快速甄別方法,其特征在于 包括以下步驟:
1)、選取套牌車樣本,建立套牌車樣本的車牌號集合;
2)、根據套牌車樣本車牌號,在大數據平臺上檢索出各樣本車輛的 過車數據;
3)、對檢索出來的過車數據進行數據預處理,包括數據清洗、特征 轉換、歸一化處理,之后進入下一步驟;
4)、采用離群點分析算法對上述數據預處理后的過車數據進行分 析,具體包括:
4a、對于經過3)步驟預處理之后的數據,計算每輛套牌車樣本的 每條過車數據與該輛車其他所有過車數據的歐幾里得距離;
4b、對上述的歐幾里得距離按從小到大的順序進行排序,計算該條 過車數據的第k距離和第k領域,進而得到該過車數據所對應的可達距 離;
4c、計算每條過車數據第k領域內所有過車數據可達距離的平均值, 得到該輛車各過車數據的可達密度;
4d、由過車數據的可達密度,獲得所有過車數據的局部離群點因子;
4e、將所有過車數據的局部離群點因子按從大到小的順序進行排 序,根據各局部離群點因子所對應的該車輛經緯度坐標和時間值,通過 速度計算公式,獲得作為套牌車的所有車輛的各速度值;以上述各速度 值中的最小值為套牌車的參考速度值;
5)、將上述參考速度值作為基準值輸入套牌車辨識系統;當需辨識 車輛在不同經緯度坐標的任意兩點出現,根據該兩點出現的時間值差異 而計算出該需辨識車輛的平均行駛速度,此時套牌車辨識系統進行以下 判斷并獲得判定結果:
當該需辨識車輛的平均行駛速度大于或等于上述參考速度值時,該 車輛車牌號為套牌,可通知相應部門處理;
當該需辨識車輛的平均行駛速度小于上述參考速度值時,該車輛為 普通車輛。
2.根據權利要求1所述的一種基于離群點分析算法的套牌車快速 甄別方法,其特征在于:所述步驟1)中,套牌車樣本包括黃牌車和藍 牌車;從卡口系統中查詢出黃牌與藍牌號碼相同的車牌號碼集合作為套 牌車樣本車輛集合。
3.根據權利要求1所述的一種基于離群點分析算法的套牌車快速 甄別方法,其特征在于:所訴步驟2)中,將套牌車樣本車牌號集合輸 入HBase數據庫中進行過車數據檢索,并通過MapReduce獲取存儲在 HBase數據庫中的數據。
4.根據權利要求1所述的一種基于離群點分析算法的套牌車快速 甄別方法,其特征在于:所述步驟3)中,
所述數據清洗步驟為:將過車數據中有缺失或者錯誤的數據刪除;
所述特征轉換步驟為:將非數字型特征屬性值轉換為數字型特征屬 性值,該非數字型特征屬性值至少包括某車輛經過某卡口所對應的時間 和該卡口編號。
5.根據權利要求1所述的一種基于離群點分析算法的套牌車快速 甄別方法,其特征在于:所述步驟4b中,將車輛某條過車數據與其他 過車數據的歐幾里得距離按從小到大的順序進行排序后,取第k個值作 為該過車數據的第k距離;以此過車數據為中心,以第k距離值為半徑 的空間區域為該過車數據的第k領域。
6.根據權利要求1所述的一種基于離群點分析算法的套牌車快速 甄別方法,其特征在于:所述步驟4c中,將某條過車數據與第k領域 中其他過車數據的歐幾里得距離,同他們各自的第k距離比較,取比較 后的最大值作為第k領域內該條過車數據所對應的可達距離;通過求得 每條過車數據第k領域內所有過車數據可達距離的平均值,對此平均值 求倒數,即得到各過車數據的可達密度。
7.根據權利要求1所述的一種基于離群點分析算法的套牌車快速 甄別方法,其特征在于:所述步驟4d中,通過計算得到某條過車數據 第k領域內所有過車數據可達密度與該條過車數據的可達密度之比,獲 得所有比值的平均值;對該平均值求倒數,即得到各過車數據的局部離 群因子;具體計算公式為:
其中:LOF(p)為p點的局部離群因子,s為屬于p點第k領域的 點,ρ(s)為s點的可達密度值,ρ(p)為p點的可達密度值,N(p)為p點 的第k領域。
將所有過車數據的局部離群因子大于所設定的基準閾值的過車數 據按離群因子從大到小的順序排列,這些點即為所要求得的局部離群點 因子,所述基準閾值的取值范圍為0.8至0.9。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽四創電子股份有限公司,未經安徽四創電子股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610182562.1/1.html,轉載請聲明來源鉆瓜專利網。





