[發明專利]聚類效果測評方法、系統、介質及裝置在審
| 申請號: | 202110292980.7 | 申請日: | 2021-03-18 |
| 公開(公告)號: | CN113011742A | 公開(公告)日: | 2021-06-22 |
| 發明(設計)人: | 尹文科;萬珺;游宇;楊朔;戴海峰;李仁最;何洪路;張迪;馬楷 | 申請(專利權)人: | 恒睿(重慶)人工智能技術研究院有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06F17/16;G06K9/62 |
| 代理公司: | 北京瀚仁知識產權代理事務所(普通合伙) 11482 | 代理人: | 王文凱;宋寶庫 |
| 地址: | 401121 重慶市渝北*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 效果 測評 方法 系統 介質 裝置 | ||
1.一種聚類效果測評方法,其特征在于,所述測評方法包括:
獲取含有標注信息的待聚類的所有數據樣本的總量,所述標注信息包括各數據樣本的真實類別名;
計算各預測分類組中不同標注信息對應的數據樣本的數量,所述預測分類組是聚類系統對所述待聚類的所有數據樣本進行聚類后得到;
基于各所述預測分類組中不同標注信息對應的數據樣本的數量確定各預測分類組的預測類別名;
計算已確定的各預測類別名對應的預測分類組中數據樣本的總量并將其確定為關聯的數據樣本的總量,以及計算各預測分類組中真實類別名與預測類別名相同的數據樣本的總量并將其確定為正確關聯的數據樣本的總量;
基于待聚類的所有數據樣本的總量、關聯的數據樣本的總量以及正確關聯的數據樣本的總量,利用混淆矩陣來計算針對所述聚類系統的聚類效果評價指標。
2.根據權利要求1所述的測評方法,其特征在于,“基于各所述預測分類組中不同標注信息對應的數據樣本的數量確定各預測分類組的預測類別名”的步驟包括:
對于一個預測分類組,將其中數據樣本的數量最多的真實類別名確定為該預測分類組的預測類別名;或者,對于一個真實類別名,將其對應的數據樣本的數量最多的預測分類組的預測類別名確定為該真實類別名;以及,
將無法確定預測類別名的預測分類組均確定為未知類別名;
其中,所有預測分類組的預測類別名均不相同。
3.根據權利要求1所述的測評方法,其特征在于,所述含有標注信息的所有數據樣本均為人像樣本,所述標注信息還包括各人像樣本中是否含有人臉;“基于各所述預測分類組中不同標注信息對應的數據樣本的數量確定各預測分類組的預測類別名”的步驟還包括:
計算各所述預測分類組中真實類別名對應的有人臉的數據樣本的數量;
對于一個預測分類組,將其中有人臉的數據樣本的數量最多的真實類別名作為該預測分類組的預測類別名;或者,對于一個真實類別名,將其對應的有人臉的數據樣本的數量最多的預測分類組的預測類別名確定為該真實類別名;以及,
將無法確定預測類別名的預測分類組均確定為未知類別名;
其中,所有預測分類組的預測類別名均不相同。
4.根據權利要求1所述的測評方法,其特征在于,所述含有標注信息的所有數據樣本均為人像樣本,所述標注信息還包括各人像樣本中是否含有人臉;所述測評方法還包括:在“基于待聚類的所有數據樣本的總量、關聯的數據樣本的總量以及正確關聯的數據樣本的總量,利用混淆矩陣來計算針對所述聚類系統的聚類效果評價指標”的步驟之前,
針對含有標注信息的所有數據樣本、有人臉的所有數據樣本和無人臉的所有數據樣本中的任一種:計算待聚類的所有數據樣本的總量、關聯的數據樣本的總量以及正確關聯的數據樣本的總量。
5.根據權利要求4所述的測評方法,其特征在于,“基于待聚類的所有數據樣本的總量、關聯的數據樣本的總量以及正確關聯的數據樣本的總量,利用混淆矩陣來計算針對所述聚類系統的聚類效果評價指標”的步驟包括:
計算數據樣本聚類的關聯率:
計算數據樣本聚類的精確率:
計算數據樣本聚類的綜合準確率:
然后,將Acc、P和Acc*P中的一個或者多個作為所述聚類效果評價指標;
其中,針對含有標注信息的所有數據樣本、有人臉的所有數據樣本和無人臉的所有數據樣本中的任一種:TP+FP+FN+TN表示待聚類的所有數據樣本的總量,TP+FP表示關聯的數據樣本的總量,TP表示正確關聯的數據樣本的總量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于恒睿(重慶)人工智能技術研究院有限公司,未經恒睿(重慶)人工智能技術研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110292980.7/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





