[發明專利]一種基于離線和在線聚類的車型數據庫清洗方法在審
| 申請號: | 201810941282.3 | 申請日: | 2018-08-17 |
| 公開(公告)號: | CN109189771A | 公開(公告)日: | 2019-01-11 |
| 發明(設計)人: | 尚凌輝;張兆生;王弘玥;余天明 | 申請(專利權)人: | 浙江捷尚視覺科技股份有限公司 |
| 主分類號: | G06F16/215 | 分類號: | G06F16/215;G06K9/62;G06N20/00 |
| 代理公司: | 杭州奧創知識產權代理有限公司 33272 | 代理人: | 王佳健 |
| 地址: | 311121 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 離線 車型 聚類 車型特征 清洗 車型數據 在線聚類 樣本 數據庫 初始聚類中心 隨機初始化 長期運行 維持系統 整體性質 連接層 標注 判定 刪除 入庫 輸出 學習 | ||
本發明公開了一種基于離線和在線聚類的車型數據庫清洗方法。本發明首先標注各類車型樣本得到離線車型庫,利用深度學習進行訓練,取訓練反向第二個的全連接層輸出作為車型特征。其次分別提取各個類內所有車型特征進行離線聚類,得到n個類中心及相應閾值。然后定期提取在線車型庫各個類內所有車型特征進行聚類,初始聚類中心為離線聚類得到的n個類中心,添加一個隨機初始化中心的類后進行有約束的聚類,得到n+1類。最后根據離線聚類得到的閾值,依次判定并清洗屬于前n類的車型數據,清洗最后一類車型數據。本發明可以在保持在線車型庫內各類整體性質不變的情況下,有效刪除錯誤入庫的樣本,從而維持系統長期運行的性能及穩定性。
技術領域
本發明涉及一種基于離線和在線聚類的車型數據庫清洗方法。
背景技術
隨著機動車保有量急劇增加,違法犯罪車輛逐年上升趨勢,例如:肇事逃逸,車輛假牌,車輛套牌,機動車超速等犯罪現象每每都在上演。而技術的發展,智能車型識別方法正成為一種成熟有效的手段,可廣泛應用在卡口車輛檢測、套牌車檢測、車輛檢索等方面。
在很多應用中,都需要建立一個在線的車型庫。基于深度學習的車型識別技術能夠達到98%以上的準確率,但在長期運行中,不斷入庫的錯誤樣本仍會導致其累積到一個難以維持系統性能及穩定性的程度。在此基礎上,需要提出一種基于離線和在線聚類的車型數據庫清洗方法,對車型庫進行定期清洗以保持系統性能及穩定性。
現有的各種數據庫清洗方法多為通用數據清洗或針對某一特定領域的數據清洗,缺少針對車型數據庫的清洗方法。如《一種數據清洗方法201710704678.1》、《一種簡化的大數據清洗方式201711182073.7》等。
發明內容
本發明針對現有技術的不足,提供了一種基于離線和在線聚類的車型數據庫清洗方法。該方法針對在線更新的車型庫存在一定量錯誤入庫數據的情況,采用離線和在線聚類,對車型庫進行定期清洗以保持系統性能及穩定性。
本發明解決技術問題所采取的技術方案為:
一.標注各類車型樣本得到離線車型庫,利用深度學習進行訓練,取訓練反向第二個的全連接層輸出作為車型特征。
二.分別提取各個類內所有車型特征進行離線聚類,得到n個類中心及相應閾值。
三.定期提取在線車型庫各個類內所有車型特征進行聚類,初始聚類中心為離線聚類得到的n個類中心,添加一個隨機初始化中心的類后進行有約束的聚類,得到n+1類。
四.根據離線聚類得到的閾值,依次判定并清洗屬于前n類的車型數據,清洗最后一類車型數據。
本發明的有益效果:本發明可以對智能車型識別應用中所建立的在線車型數據庫進行定期快速清洗,可以在保持在線車型庫內各類整體性質不變的情況下,有效刪除錯誤入庫的樣本,從而維持系統長期運行的性能及穩定性。
附圖說明
圖1為離線深度學習訓練網絡結構。
具體實施方式
為使本發明實施例的目的、技術方案和優點更加清楚,下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整的描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基于本發明的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他的實施例,都屬于本發明保護的范圍。
本發明的離線部分包括車型特征訓練和車型特征離線聚類,在線部分包括車型特征提取、車型特征在線聚類。
一.標注各類車型樣本得到離線車型庫,利用深度學習進行訓練,取訓練反向第二個的全連接層輸出作為車型特征。
二.分別提取各個類內所有車型特征進行聚類,得到n個類中心及相應閾值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江捷尚視覺科技股份有限公司,未經浙江捷尚視覺科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810941282.3/2.html,轉載請聲明來源鉆瓜專利網。





