[發明專利]基于用戶數據的多模項集的用戶身份識別方法及系統在審
| 申請號: | 202011109382.3 | 申請日: | 2020-10-16 |
| 公開(公告)號: | CN112381112A | 公開(公告)日: | 2021-02-19 |
| 發明(設計)人: | 楊燦;王瀾 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 雷芬芬 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 用戶 數據 多模項集 身份 識別 方法 系統 | ||
本發明公開了一種基于用戶數據的多模項集的用戶身份識別方法及系統,其中,方法包括步驟:分別構造歷史數據和待識別用戶數據的可擴展多模項集;將歷史數據的可擴展多模項集和待識別用戶數據的可擴展多模項集,進行相似性度量;根據相似性度量結果,對用戶識別結果做出決策。本發明從構建多模項集、相似性度量、融合決策這幾個角度,全面提升用戶識別方法的性能,可廣泛應用于個性化推薦、信息取證等領域。
技術領域
本發明涉及用戶識別領域,尤其涉及一種基于用戶數據的多模項集的用戶身份識別方法及系統。
背景技術
當前,隨著互聯網及大數據技術的蓬勃發展,人們在享受其帶來的便利的同時,不經意留下許多數字痕跡,為用戶識別問題的研究提供了有效數據。利用人們留下的數字痕跡進行統計特征匹配是解決用戶識別問題的重要方法。然而,如何使用有限的數字特征實現精準的用戶識別成為研究人員爭相探索的問題。
人們在信息空間中留下的活動痕跡會隨著時間自然而然形成一個序列,比如,用戶訪問的網站、購買的商品、觀看的頻道隨著時間的推移形成了能夠反映用戶相應行為特征的序列。我們關注序列中出現較為頻繁的用戶行為(也稱為頻繁項),利用由此組成的集合——頻繁項集做進一步研究。因頻繁項集能在較長的時間范圍內穩定地保持與用戶行為主體的關聯性,并且難以隱藏。因此,行業內急需研發一種利用這一特點構建可擴展的多模項集,并用于實現用戶識別的方法或者系統。
發明內容
本發明的主要目的在于提供一種基于用戶數據的多模項集的用戶身份識別方法及系統,通過構建多模項集、相似性度量、融合決策,能更加有效地提升用戶識別方法的性能。
為達到上述發明目的,本發明提出如下技術方案:
一種基于用戶數據的多模項集的用戶身份識別方法,包括步驟:
構造待識別用戶數據的可擴展多模項集;
將待識別用戶數據的可擴展多模項集和預先構造的歷史數據的可擴展多模項集進行相似性度量;
根據相似性度量結果,對用戶識別結果做出決策,得到識別結果。
優選地,構造待識別用戶數據的可擴展多模項集和構造歷史數據的可擴展多模項集的步驟均為MISFUB,MISFUB具體包括:
S2.1,組建可擴展多模項;將用戶的行為、狀態或事件記作Item,用戶的項目序列記作Item Sequence={Item1,Item2,Item3,……,ItemNr},其中Nr為正整數;
將可擴展項集的模記作n;其中1級項集即為自然狀態下的Item Sequence,記作C1={Si|i=1,2,……,Nr};2級項集記作C2={Sij|i=1,2,……,Nr-1且j=i+1,……,Nr};3級項集記作C3={Sijk|i=1,2,……,Nr-2且j=i+1,……,Nr-1且k=i+2,……,Nr};n級項集記作Cn={Si1i2…in|i1=1,2,……,Nr-n+1且ik=i1+k-1,k=1,2,……,n};Si1i2…in表示從Nr個項中取n個項組成的序列;
S2.2,對步驟S2.1所得的n個多模項集求并集,即:
S2.3,對中的每一個序列S按其出現的頻率進行降序排序,即:其中是中第m個序列的頻率,m=1,2,……,Length
S2.4,定義比例值rtop,即:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011109382.3/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





