[發明專利]聚類方法及裝置、電子設備和存儲介質在審
| 申請號: | 202011566702.8 | 申請日: | 2020-12-25 |
| 公開(公告)號: | CN112508130A | 公開(公告)日: | 2021-03-16 |
| 發明(設計)人: | 唐詩翔;陳大鵬;趙瑞 | 申請(專利權)人: | 商湯集團有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 劉鶴;張穎玲 |
| 地址: | 中國香港新界沙田香港科學園科技*** | 國省代碼: | 香港;81 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 方法 裝置 電子設備 存儲 介質 | ||
本公開實施例提出了一種聚類方法及裝置、電子設備和存儲介質中,該方法包括:獲取用于校正人臉特征相似度的神經網絡,所述神經網絡是基于困難樣本訓練得到;所述困難樣本是至少一個類別人臉數據集中的樣本;基于所述神經網絡對待聚類圖像進行處理,得出所述待聚類圖像的人臉特征的相似度校正值;利用所述相似度校正值對特征相似度進行校正,得到校正后的特征相似度;所述特征相似度表示所述待聚類圖像與對應類別圖像的人臉特征的相似度;基于所述校正后的特征相似度,對所述待聚類圖像進行聚類處理,得到所述待聚類圖像與所述對應類別圖像的聚類結果。
技術領域
本公開涉及計算機視覺處理技術,尤其涉及一種聚類方法及裝置、電子設備和存儲介質。
背景技術
在相關技術中,聚類是數據挖掘的重要步驟之一。通過聚類,可以發掘數據中的結構,并提取有效信息用于進一步分析。
然而,相關技術中,由于人臉特征具有較復雜的分布,可能導致人臉聚類模型不能適應于各類人臉(例如:老人、小孩、黑種人等)的聚類,即,存在人臉聚類模型對部分類型的人臉聚類精度較低的問題。
發明內容
本公開實施例期望提供聚類處理的技術方案。
本公開實施例提供了一種聚類方法,所述方法包括:
獲取用于校正人臉特征相似度的神經網絡,所述神經網絡是基于困難樣本訓練得到;所述困難樣本是至少一個類別人臉數據集中的樣本;
基于所述神經網絡對待聚類圖像進行處理,得出所述待聚類圖像的人臉特征的相似度校正值;
利用所述相似度校正值對特征相似度進行校正,得到校正后的特征相似度;所述特征相似度表示所述待聚類圖像與對應類別圖像的人臉特征的相似度;
基于所述校正后的特征相似度,對所述待聚類圖像進行聚類處理,得到所述待聚類圖像與對應類別圖像的聚類結果。
在一些實施例中,所述方法還包括:
獲取需要進行人臉聚類的多個類別人臉數據集的樣本和所述多個類別人臉數據集的樣本中每個樣本的標注信息;
確定第一相似度閾值,其中,所述第一相似度閾值表示使所述多個類別人臉數據集的樣本的聚類結果的精度達到設定精度指標的相似度閾值;
基于所述第一相似度閾值,對所述各樣本進行聚類處理,得到所述多個類別人臉數據集的樣本的聚類結果;
基于所述多個類別人臉數據集的樣本的聚類結果確定滿足設定條件的樣本,在所述滿足設定條件的樣本中確定出所述困難樣本,所述設定條件包括:樣本的聚類結果與樣本的標注信息不同。
在一些實施例中,所述確定第一相似度閾值,包括:
基于預先確定的多個相似度閾值的每個相似度閾值,并對所述各樣本進行聚類處理,得到所述每個相似度閾值對應的聚類結果;
基于所述每個相似度閾值對應的聚類結果,確定聚類的精度達到設定精度指標的多個第二相似度閾值;
在所述多個第二相似度閾值中,確定最大的相似度閾值為第一相似度閾值。
在一些實施例中,所述在滿足設定條件的樣本中確定出所述困難樣本,包括:
采用正負樣本平衡的方式,在所述滿足設定條件的樣本中確定出所述困難樣本,其中,所述困難樣本包括正樣本和負樣本,所述正樣本表示標注為同一個人臉的一對樣本圖像,所述負樣本表示標注為不同人臉的一對樣本圖像。
在一些實施例中,所述神經網絡是基于困難樣本訓練得到的,包括:
將所述困難樣本輸入至所述神經網絡;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于商湯集團有限公司,未經商湯集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011566702.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種負載電流切換快速響應LDO電路
- 下一篇:一種柔性機制砂石干法生產工藝





