[發明專利]聚類效果測評方法、系統、介質及裝置在審
| 申請號: | 202110292980.7 | 申請日: | 2021-03-18 |
| 公開(公告)號: | CN113011742A | 公開(公告)日: | 2021-06-22 |
| 發明(設計)人: | 尹文科;萬珺;游宇;楊朔;戴海峰;李仁最;何洪路;張迪;馬楷 | 申請(專利權)人: | 恒睿(重慶)人工智能技術研究院有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06F17/16;G06K9/62 |
| 代理公司: | 北京瀚仁知識產權代理事務所(普通合伙) 11482 | 代理人: | 王文凱;宋寶庫 |
| 地址: | 401121 重慶市渝北*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 效果 測評 方法 系統 介質 裝置 | ||
本發明屬于圖像數據處理的技術領域,具體涉及一種聚類效果測評方法、系統、介質及裝置。本發明旨在解決現有的測評方法無法對聚類系統在商場業務中的跨鏡追蹤的效果進行有效評價的問題。為此目的,本發明利用含有標注信息的待聚類的所有數據樣本,在聚類系統對待聚類的所有數據樣本聚類后得到的所有預測分類組后,基于所述待聚類的所有數據樣本的總量、關聯的數據樣本的總量、正確關聯的數據樣本的總量,利用混淆矩陣來計算針對所述聚類系統的聚類效果評價指標。如此,本發明不同于現有測評方法重點關注每個分類組中數據樣本的排列效果,而是更關注聚類結果的綜合準確性,從而有利于對聚類系統在商場業務中的跨鏡追蹤的效果進行有效評價。
技術領域
本發明屬于圖像數據處理的技術領域,具體涉及一種聚類效果測評方法、系統、介質及裝置。
背景技術
聚類是數據挖掘的一種方法。在圖像處理技術領域中,圖像聚類是基于圖像特征將多幅圖像分成由類似的圖像組成的多個類的過程。圖像聚類在圖像分割、目標跟蹤等領域具有重要的作用。目前在商業場景中,聚類系統和跨鏡追蹤(ReId)技術應用的非常廣泛,目的在于解決跨攝像頭跨場景下行人的識別與檢索,可以對無法獲取清晰拍攝人臉的行人進行跨攝像頭連續跟蹤,增強數據的時空連續性。例如在大型商場中,對商場各個點位的攝像頭采集到的抓拍圖進行聚類,可以描繪出單個顧客的行動軌跡,分析出顧客在不同攝像頭下的停留時間,出入店鋪,便于商場對顧客精細化服務。
同時,在商場這種復雜場景下,聚類系統在實際應用時往往會面臨的一些問題,如不同相機拍攝角度差異大、監控抓拍圖片模糊不清、行人更換服裝配飾、秋冬穿衣風格不同、白天晚上的光線差異等都會影響聚類的結果。由于在聚類場景多種多樣,聚類過程可能會出現誤差,將本不屬于同一類的圖像歸為同一個圖像簇,則該圖像簇的中心會發生偏移,使得后續的聚類結果越來越不準確。對于這些問題,聚類系統需要一個完善的測評方法對聚類結果進行測評,判斷該系統在實際情況下是否具備實際應用價值。
目前,針對聚類系統的常用的測評方式,是在Market1501,DukeMTMC-reID,CUHK03三個數據集上進行指標測試,包括兩個指標Rank1和mAP。Rank1指標是把聚類系統看做一個排序系統,Rank是排序命中率核心指標,Rank1是首位命中率,就是排在第一位的圖有沒有命中他本人,Rank5是1-5張圖有沒有至少一張命中他本人。而mAP是平均精度均值,計算方法為真實排序位置除以實際排序位置的值均值。可知,現有的上述Rank1和mAP兩種指標都是把聚類系統作為排序問題來量化,注重軌跡的排序位置,抓拍圖形成軌跡的順序排列是否符合預期。
但是,聚類系統在商場業務的應用中需要實現跨鏡追蹤的功能,該功能要求將顧客的行動軌跡和人臉進行綁定,還對實時性有較高的要求。現有的上述聚類效果測評方法重點關注每個分類組中數據樣本的排列效果,從而導致無法對聚類系統在商場業務中的跨鏡追蹤的效果進行有效評價。
相應地,本領域需要一種聚類效果測評方法、系統、介質及裝置來解決上述問題。
發明內容
為了解決或至少部分解決:現有的測評方法無法對聚類系統在商場業務中的跨鏡追蹤的效果進行有效評價的問題。本發明提供了一種聚類效果測評方法、系統、介質及裝置。
第一方面,本發明提供了一種聚類效果測評方法,所述測評方法包括:獲取含有標注信息的待聚類的所有數據樣本的總量,所述標注信息包括各數據樣本的真實類別名;計算各預測分類組中不同標注信息對應的數據樣本的數量,所述預測分類組是聚類系統對所述待聚類的所有數據樣本進行聚類后得到;基于各所述預測分類組中不同標注信息對應的數據樣本的數量確定各預測分類組的預測類別名;計算已確定的各預測類別名對應的預測分類組中數據樣本的總量并將其確定為關聯的數據樣本的總量,以及計算各預測分類組中真實類別名與預測類別名相同的數據樣本的總量并將其確定為正確關聯的數據樣本的總量;基于待聚類的所有數據樣本的總量、關聯的數據樣本的總量以及正確關聯的數據樣本的總量,利用混淆矩陣來計算針對所述聚類系統的聚類效果評價指標。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于恒睿(重慶)人工智能技術研究院有限公司,未經恒睿(重慶)人工智能技術研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110292980.7/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





