[發(fā)明專利]特征聚類方法、數(shù)據(jù)庫更新方法、電子設(shè)備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202011530197.1 | 申請日: | 2020-12-22 |
| 公開(公告)號: | CN112560731B | 公開(公告)日: | 2022-07-01 |
| 發(fā)明(設(shè)計)人: | 蔡嘯;肖瀟;章勇 | 申請(專利權(quán))人: | 蘇州科達科技股份有限公司 |
| 主分類號: | G06V20/40 | 分類號: | G06V20/40;G06V10/44;G06V10/74;G06V10/762;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京三聚陽光知識產(chǎn)權(quán)代理有限公司 11250 | 代理人: | 張琳琳 |
| 地址: | 215011 江*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 特征 方法 數(shù)據(jù)庫 更新 電子設(shè)備 存儲 介質(zhì) | ||
本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,具體涉及特征聚類方法、數(shù)據(jù)庫更新方法及裝置,所述特征聚類方法包括獲取各個待聚類特征;基于各個待聚類特征,確定第一權(quán)重圖,第一權(quán)重圖中的節(jié)點包括各個待聚類特征,所述第一權(quán)重圖中的邊為兩個節(jié)點對應(yīng)的特征相似度;將第一權(quán)重圖輸入聚類網(wǎng)絡(luò)中,確定各個待聚類特征的初次聚類結(jié)果,所述初次聚類結(jié)果包括各個待聚類特征對應(yīng)的初始簇以及各個初始簇的代表特征;基于初次聚類結(jié)果,構(gòu)建第二權(quán)重圖,所述第二權(quán)重圖中的節(jié)點包括各個初始簇的代表特征;將第二權(quán)重圖輸入聚類網(wǎng)絡(luò)中,以確定各個待聚類特征的目標聚類結(jié)果。利用自底向上、層次聚類的框架,來達到準確率與召回率的平衡。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,具體涉及特征聚類方法、數(shù)據(jù)庫更新方法、電子設(shè)備及存儲介質(zhì)。
背景技術(shù)
人員識別及車輛識別是安防大數(shù)據(jù)應(yīng)用中的重要一環(huán),例如,針對嫌疑人的追蹤,大部分監(jiān)控視頻的像素清晰度不夠識別出人臉,這時候就需要對嫌疑人的外形特征進行追蹤,再配上載具、同伴、隨行物品等其他特征,就可以有效地對嫌疑人進行軌跡研判。然而,對于人臉識別或車輛識別是一個開集問題,現(xiàn)實場景中的人員或車輛通常沒有在訓練樣本中出現(xiàn)過,所以無法使用分類算法,通過網(wǎng)絡(luò)推理直接得到人員或車輛標簽。作為對比,特征聚類對訓練樣本的要求稍低,只需要知道樣本的特征描述、相似度度量標準就可以完成人員識別。
現(xiàn)有的聚類算法一般是利用深度學習算法,進行特征提取后再進行兩兩比對,并通過設(shè)置閾值來進行二值判斷。然而,這種方法的問題在于,存在經(jīng)驗型超參數(shù),難以穩(wěn)定地取得準確率與召回率的平衡,在不同場景下的落地效果存在大量的調(diào)試成本。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實施例提供了一種特征聚類方法、數(shù)據(jù)庫更新方法、電子設(shè)備及存儲介質(zhì),以解決現(xiàn)有聚類算法所導致的難以穩(wěn)定地取得準確率與召回率平衡的問題。
根據(jù)第一方面,本發(fā)明實施例提供了一種特征聚類方法,包括:
獲取各個待聚類特征;
基于所述各個待聚類特征,確定第一權(quán)重圖,所述第一權(quán)重圖中的節(jié)點包括各個所述待聚類特征,所述第一權(quán)重圖中的邊為兩個節(jié)點對應(yīng)的特征相似度;
將所述第一權(quán)重圖輸入聚類網(wǎng)絡(luò)中,確定各個所述待聚類特征的初次聚類結(jié)果,所述初次聚類結(jié)果包括各個所述待聚類特征對應(yīng)的初始簇以及各個所述初始簇的代表特征;
基于所述初次聚類結(jié)果,構(gòu)建第二權(quán)重圖,所述第二權(quán)重圖中的節(jié)點包括各個所述初始簇的代表特征;
將所述第二權(quán)重圖輸入所述聚類網(wǎng)絡(luò)中,以確定各個所述待聚類特征的目標聚類結(jié)果。
本發(fā)明實施例提供的特征聚類方法,在確定出各個待聚類特征的初次聚類結(jié)果之后,再結(jié)合初次聚類結(jié)果進行二次聚類,利用自底向上、層次聚類的框架,來達到準確率與召回率的平衡。即,一方面,單次聚類高準確率,以預防不同特征合并成超大簇;另一方面,用層次聚類(多次調(diào)用)來提高整個流程的召回率將初次聚類結(jié)果中的小簇轉(zhuǎn)換成成第二次聚類輸入中的節(jié)點,進行小簇與小簇的合并,提高召回率。
結(jié)合第一方面,在第一方面第一實施方式中,所述待聚類特征為新增特征,所述基于所述各個待聚類特征,確定第一權(quán)重圖,包括:
對所述各個待聚類特征進行聚類處理,得到所述各個待聚類特征對應(yīng)的預設(shè)數(shù)量的最相似待聚類特征及其相似度;
基于所述各個待聚類特征對應(yīng)的預設(shè)數(shù)量的最相似待聚類特征及其相似度,構(gòu)建所述第一權(quán)重圖。
本發(fā)明實施例提供的特征聚類方法,僅利用待聚類特征進行第一權(quán)重圖的構(gòu)建,減少了聚類的數(shù)據(jù)處理量,提高了特征聚類的效率。
結(jié)合第一方面第一實施方式,在第一方面第二實施方式中,所述基于所述初次聚類結(jié)果,構(gòu)建第二權(quán)重圖,包括:
獲取各個歷史簇的代表特征;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州科達科技股份有限公司,未經(jīng)蘇州科達科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011530197.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)庫
- 數(shù)據(jù)庫管理系統(tǒng)及數(shù)據(jù)庫
- 數(shù)據(jù)庫構(gòu)筑裝置、數(shù)據(jù)庫檢索裝置、數(shù)據(jù)庫裝置、數(shù)據(jù)庫構(gòu)筑方法、以及數(shù)據(jù)庫檢索方法
- 數(shù)據(jù)庫和數(shù)據(jù)庫處理方法
- 數(shù)據(jù)庫系統(tǒng)、數(shù)據(jù)庫更新方法、數(shù)據(jù)庫以及數(shù)據(jù)庫更新程序
- 容器數(shù)據(jù)庫
- 數(shù)據(jù)庫同步方法及數(shù)據(jù)庫
- 一種MongoDB數(shù)據(jù)庫對象復制延遲監(jiān)控方法和裝置
- 數(shù)據(jù)分布式存儲方法、裝置、電子設(shè)備及存儲介質(zhì)
- 數(shù)據(jù)庫語句執(zhí)行方法及裝置





