[發明專利]一種用戶間相似性距離測度方法、系統、裝置和存儲介質在審
| 申請號: | 202010522036.1 | 申請日: | 2020-06-10 |
| 公開(公告)號: | CN111914876A | 公開(公告)日: | 2020-11-10 |
| 發明(設計)人: | 楊燦;王瀾 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 胡輝 |
| 地址: | 510641 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用戶 相似性 距離 測度 方法 系統 裝置 存儲 介質 | ||
1.一種用戶間相似性距離測度方法,其特征在于,包括以下步驟:
對用戶數據集合進行混合多元特征熱度排序處理,并提取用于計算相似性距離的兩個特征集合;
計算所述兩個特征集合的各公共元素對相似性距離的影響值,并將獲得的所述影響值進行求和后作為相似性距離。
2.根據權利要求1所述的一種用戶間相似性距離測度方法,其特征在于,所述對用戶數據集合進行混合多元特征熱度排序處理,并提取用于計算相似性距離的兩個特征集合,包括:
根據所述用戶數據集合提取混合多元的行為特征,獲得用戶行為特征集合;
根據預設公式計算所述用戶行為特征集合中每個所述行為特征的熱度;
根據所述熱度對所述行為特征進行排序,根據排序結果獲取N個所述行為特征組成特征集合;
其中,N為大于1的整數。
3.根據權利要求2所述的一種用戶間相似性距離測度方法,其特征在于,所述預設公式為:
其中,為所述行為特征fi出現的次數,C為所述行為特征總個數,為所有所述行為特征出現的次數。
4.根據權利要求2所述的一種用戶間相似性距離測度方法,其特征在于,所述根據所述熱度對所述行為特征進行排序,根據排序結果獲取N個所述行為特征組成特征集合,包括:
根據所述熱度將所述行為特征進行降序排列,所述行為特征包括一元行為特征、二元行為特征和三元行為特征;
按照排列順序獲取前N個所述行為特征組成特征集合。
5.根據權利要求2所述的一種用戶間相似性距離測度方法,其特征在于,所述行為特征包括一元行為特征、二元行為特征和三元行為特征,所述根據所述熱度對所述行為特征進行排序,根據排序結果獲取N個所述行為特征組成特征集合,包括:
根據所述熱度將所述一元行為特征進行降序排列,按照排列順序獲取前N個所述一元行為特征;
根據所述熱度將所述二元行為特征進行降序排列,按照排列順序獲取前N個所述二元行為特征;
根據所述熱度將所述三元行為特征進行降序排列,按照排列順序獲取前N個所述三元行為特征;
將獲得的所述一元行為特征、所述二元行為特征和所述三元行為特征進行混合,根據所述熱度將混合后的行為特征進行降序排列,按照排列順序獲取前N個所述行為特征組成特征集合。
6.根據權利要求1所述的一種用戶間相似性距離測度方法,其特征在于,所述兩個特征集合為特征集合A和特征集合B,在所述計算所述兩個特征集合的各公共元素對相似性距離的影響值之前,還包括以下步驟:
計算所述特征集合A和所述特征集合B的交集I,以及計算所述特征集合A和所述特征集合B的并集U,計算所述交集I的大小LI和所述并集U的大小LU;
計算交集I的所述公共元素在集合I∩A中的排序索引值iAI,計算交集I的所述公共元素在集合I∩B中的排序索引值iBI。
7.根據權利要求6所述的一種用戶間相似性距離測度方法,其特征在于,采用以下公式計算所述公共元素對相似性距離的影響值:
交集I中第v個所述公共元素對相似性距離的影響值Fv的計算公式定義為:
或
交集I中第v個所述公共元素對相似性距離的影響值Fv的計算公式定義為:
或
交集I中第v個所述公共元素對相似性距離的影響值Fv的計算公式定義為:
其中,dA表示元素在所述特征集合A的索引值,dB表示元素在所述特征集合B的索引值。
8.一種用戶間相似性距離測度系統,其特征在于,包括:
特征提取模塊,用于對用戶數據集合進行混合多元特征熱度排序處理,并提取用于計算相似性距離的兩個特征集合;
距離計算模塊,用于計算所述兩個特征集合的各公共元素對相似性距離的影響值,并將獲得的所述影響值進行求和后作為相似性距離。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010522036.1/1.html,轉載請聲明來源鉆瓜專利網。





