[發(fā)明專利]聚類中心確定方法、裝置和設(shè)備及計算機存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202110298057.4 | 申請日: | 2021-03-19 |
| 公開(公告)號: | CN113704528A | 公開(公告)日: | 2021-11-26 |
| 發(fā)明(設(shè)計)人: | 郭卉 | 申請(專利權(quán))人: | 騰訊科技(北京)有限公司 |
| 主分類號: | G06F16/55 | 分類號: | G06F16/55;G06F16/532;G06F16/583;G06F16/732;G06F16/75;G06F16/783;G06K9/62 |
| 代理公司: | 北京同達信恒知識產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 朱佳 |
| 地址: | 100080 北京市海淀區(qū)海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 中心 確定 方法 裝置 設(shè)備 計算機 存儲 介質(zhì) | ||
本申請公開了一種聚類中心確定方法、裝置和設(shè)備及計算機存儲介質(zhì),涉及人工智能技術(shù)領(lǐng)域,用于提升圖像表示的準確性以及圖像聚類效果。該方法包括:獲取圖像樣本集合,并基于圖像樣本集合,采用圖像聚類模型進行多輪聚類,直到滿足預(yù)設(shè)的收斂條件為止,一輪聚類中包括以下操作:對圖像樣本集合中的各個圖像樣本分別進行特征編碼,基于編碼結(jié)果獲得相應(yīng)的多個特征表示向量,以及確定特征表示損失值;對多個特征表示向量進行聚類,并基于聚類結(jié)果確定聚類損失值;基于特征表示損失值和聚類損失值確定圖像聚類模型未收斂時,對圖像聚類模型進行參數(shù)調(diào)整;輸出最后一輪聚類獲得的聚類結(jié)果包含的多個聚類中心向量,一個聚類中心向量對應(yīng)一個圖像類別。
技術(shù)領(lǐng)域
本申請涉及計算機技術(shù)領(lǐng)域,尤其涉及人工智能(Artificial Intelligence,AI)技術(shù)領(lǐng)域,提供一種聚類中心確定方法、裝置和設(shè)備及計算機存儲介質(zhì)。
背景技術(shù)
大規(guī)模圖像檢索常依賴于分桶檢索,分桶檢索主要是把原始大量數(shù)據(jù)先分成多個不重疊的數(shù)據(jù)子集合,每個數(shù)據(jù)子集合屬于一個分桶,檢索時只要從與目標樣本最匹配的桶中尋找匹配樣本即可,以提升檢索效率。一般而言,分桶采用聚類的方式產(chǎn)生,即對于100萬樣本,若分成1萬桶,則聚類中心為1萬。分桶的效果對檢索最終的結(jié)果影響極大,理想情況下,期望具有相似特征的樣本能分到同一個桶,以使得某個桶的召回與真實樣本相似。
然而,目前在進行聚類時,通常是基于已學(xué)習(xí)的圖像表示進行聚類來獲得聚類中心,因而圖像表示的準確性直接決定了聚類效果的好壞,當特征學(xué)習(xí)不佳時極容易造成分桶相似度不足,進而影響后續(xù)的檢索準確性。
發(fā)明內(nèi)容
本申請實施例提供一種聚類中心確定方法、裝置和設(shè)備及計算機存儲介質(zhì),用于提升圖像表示的準確性以及圖像聚類效果。
一方面,提供一種聚類中心確定方法,所述方法包括:
獲取圖像樣本集合,并基于所述圖像樣本集合,采用圖像聚類模型進行多輪聚類,直到滿足預(yù)設(shè)的收斂條件為止,其中,一輪聚類中包括以下操作:
對所述圖像樣本集合中的各個圖像樣本分別進行特征編碼,基于編碼結(jié)果獲得相應(yīng)的多個特征表示向量,以及確定特征表示損失值;
對所述多個特征表示向量進行聚類,并基于聚類結(jié)果確定聚類損失值;
基于所述特征表示損失值和所述聚類損失值確定所述圖像聚類模型未收斂時,對所述圖像聚類模型進行參數(shù)調(diào)整;
輸出最后一輪聚類獲得的聚類結(jié)果包含的多個聚類中心向量,一個聚類中心向量對應(yīng)一個圖像類別。
一方面,提供一種聚類中心確定裝置,所述裝置包括:
樣本獲取單元,用于獲取圖像樣本集合;
聚類單元,用于基于所述圖像樣本集合,采用圖像聚類模型進行多輪聚類,直到滿足預(yù)設(shè)的收斂條件為止,其中,所述聚類單元包括特征編碼子單元、聚類子單元和模型調(diào)整子單元:
所述特征編碼子單元用于對所述圖像樣本集合中的各個圖像樣本分別進行特征編碼,基于編碼結(jié)果獲得相應(yīng)的多個特征表示向量,以及確定特征表示損失值;
所述聚類子單元用于對所述多個特征表示向量進行聚類,并基于聚類結(jié)果確定聚類損失值;
所述模型調(diào)整子單元用于基于所述特征表示損失值和所述聚類損失值確定所述圖像聚類模型未收斂時,對所述圖像聚類模型進行參數(shù)調(diào)整;
輸出單元,用于輸出最后一輪聚類獲得的聚類結(jié)果包含的多個聚類中心向量,一個聚類中心向量對應(yīng)一個圖像類別。
可選的,所述特征編碼子單元,具體用于:
針對所述各個圖像樣本,分別進行至少一次基礎(chǔ)特征提取,獲得相應(yīng)的基礎(chǔ)特征向量;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(北京)有限公司,未經(jīng)騰訊科技(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110298057.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





