[發明專利]一種對象分類方法、裝置、終端設備及存儲介質在審
| 申請號: | 202111270518.3 | 申請日: | 2021-10-29 |
| 公開(公告)號: | CN113920373A | 公開(公告)日: | 2022-01-11 |
| 發明(設計)人: | 王洪波;余濤;楊貴鋒 | 申請(專利權)人: | 平安銀行股份有限公司 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/762;G06V10/774 |
| 代理公司: | 深圳中一聯合知識產權代理有限公司 44414 | 代理人: | 任敏 |
| 地址: | 518000 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 對象 分類 方法 裝置 終端設備 存儲 介質 | ||
本申請適用于數據處理技術領域,提供了一種對象分類方法、裝置、終端設備及存儲介質,其中,對象分類方法包括:獲取待分類數據;待分類數據通過待分類對象的特征向量描述;獲取對包括多個樣本數據的樣本集進行聚類操作得到的樣本子集;樣本數據由一個樣本對象的特征向量和樣本對象所屬的類別組成,每個樣本子集中均包括至少一個樣本數據,樣本子集的數量小于樣本集中包括的樣本數據的數量;分別計算待分類數據與每個樣本子集之間的第一距離值;從所有樣本子集中確定出K個樣本子集,將K個樣本子集對應的類別中出現頻率最高的類別確定為待分類對象所屬的類別,從而降低了對處理器資源的消耗量,且提高了對象的分類速度。
技術領域
本申請屬于數據處理技術領域,尤其涉及一種對象分類方法、裝置、終端設備及存儲介質。
背景技術
對對象進行特征識別并分類是實現個性化推薦的基礎。現有技術中常用的一種對象分類方法為基于K最鄰近(K-nearest neighbor,KNN)算法的對象分類方法。KNN算法的核心思想是,如果一個待分類對象在特征空間中的K個最鄰近的樣本中的大多數屬于某一個類別,則該待分類對象也屬于這個類別,并具有這個類別中的樣本的特征。也就是說,在采用現有的KNN算法對對象進行分類時,處理器需要分別計算待分類對象與特征空間中的每個樣本之間的距離值,而由于特征空間中的樣本數量通常較為龐大,因此采用現有的KNN算法對對象進行分類時需要消耗較多的處理器資源,且分類速度較慢。
發明內容
有鑒于此,本申請實施例提供了一種對象分類方法、裝置、終端設備及存儲介質,以解決采用現有的KNN算法對對象進行分類時需要消耗較多的處理器資源,且分類速度較慢的技術問題。
第一方面,本申請實施例提供一種對象分類方法,包括:
獲取待分類數據;所述待分類數據通過待分類對象的特征向量描述;
獲取對包括多個樣本數據的樣本集進行聚類操作得到的樣本子集;所述樣本數據由一個樣本對象的特征向量和所述樣本對象所屬的類別組成,每個所述樣本子集中均包括至少一個所述樣本數據,所述樣本子集的數量小于所述樣本集中包括的樣本數據的數量;
分別計算所述待分類數據與每個所述樣本子集之間的第一距離值;
從所有所述樣本子集中確定出K個樣本子集,將所述K個樣本子集對應的類別中出現頻率最高的類別確定為所述待分類對象所屬的類別;所述K個樣本子集各自對應的所述第一距離值均小于除所述K個樣本子集之外的任一樣本子集對應的所述第一距離值,所述樣本子集對應的類別由所述樣本子集包括的各個樣本數據中的樣本對象所屬的類別確定得到。
可選的,在所述分別計算所述待分類數據與每個所述樣本子集之間的第一距離值之前,所述方法還包括:
將所述樣本集中的每個樣本數據均作為一個樣本子集;
重復執行計算每兩個樣本子集之間的第二距離值,將所有所述第二距離值中的最小值對應的至少兩個樣本子集合并為一個新的樣本子集的步驟,直至所述樣本子集的數量等于或小于預設數目為止。
可選的,所述兩個樣本子集中至少有一個樣本子集包括多個樣本數據;對應地,所述計算每兩個樣本子集之間的第二距離值,包括:
計算所述兩個樣本子集的其中一個樣本子集中的每個樣本數據與另一個樣本子集中的每個樣本數據之間的歐式距離;
將所有所述歐式距離的平均值確定為所述兩個樣本子集之間的第二距離值。
可選的,所述樣本子集中包括多個樣本數據;對應地,所述分別計算所述待分類數據與每個所述樣本子集之間的第一距離值,包括:
基于所述樣本子集包括的各個樣本數據中的樣本對象的特征向量確定所述樣本子集的特征向量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安銀行股份有限公司,未經平安銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111270518.3/2.html,轉載請聲明來源鉆瓜專利網。





