[發(fā)明專利]一種基于離線和在線聚類的車型數(shù)據(jù)庫清洗方法在審
| 申請?zhí)枺?/td> | 201810941282.3 | 申請日: | 2018-08-17 |
| 公開(公告)號: | CN109189771A | 公開(公告)日: | 2019-01-11 |
| 發(fā)明(設計)人: | 尚凌輝;張兆生;王弘玥;余天明 | 申請(專利權)人: | 浙江捷尚視覺科技股份有限公司 |
| 主分類號: | G06F16/215 | 分類號: | G06F16/215;G06K9/62;G06N20/00 |
| 代理公司: | 杭州奧創(chuàng)知識產(chǎn)權代理有限公司 33272 | 代理人: | 王佳健 |
| 地址: | 311121 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 離線 車型 聚類 車型特征 清洗 車型數(shù)據(jù) 在線聚類 樣本 數(shù)據(jù)庫 初始聚類中心 隨機初始化 長期運行 維持系統(tǒng) 整體性質(zhì) 連接層 標注 判定 刪除 入庫 輸出 學習 | ||
1.一種基于離線和在線聚類的車型數(shù)據(jù)庫清洗方法,其特征在于該方法包括以下步驟:
一.標注各類車型樣本得到離線車型庫,利用深度學習進行訓練,取訓練反向第二個的全連接層輸出作為車型特征;
二.分別提取各個類內(nèi)所有車型特征進行離線聚類,得到n個類中心及相應閾值;
三.定期提取在線車型庫各個類內(nèi)所有車型特征進行聚類,初始聚類中心為離線聚類得到的n個類中心,添加一個隨機初始化中心的類后進行有約束的聚類,得到n+1類;
四.根據(jù)離線聚類得到的閾值,依次判定并清洗屬于前n類的車型數(shù)據(jù),清洗最后一類車型數(shù)據(jù)。
2.根據(jù)權利要求1所述的一種基于離線和在線聚類的車型數(shù)據(jù)庫清洗方法,其特征在于:全連接層共輸出512維特征。
3.根據(jù)權利要求1所述的一種基于離線和在線聚類的車型數(shù)據(jù)庫清洗方法,其特征在于:離線聚類過程中的特征距離采用余弦相似度,通過統(tǒng)計類內(nèi)所有特征與類中心距離的標準差來得到閾值。
4.根據(jù)權利要求1所述的一種基于離線和在線聚類的車型數(shù)據(jù)庫清洗方法,其特征在于:有約束的聚類是指約束前n類中心偏移度小于30度進行聚類。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江捷尚視覺科技股份有限公司,未經(jīng)浙江捷尚視覺科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810941282.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





