[發明專利]標簽分析方法、裝置及計算機可讀存儲介質在審
| 申請號: | 201910975812.0 | 申請日: | 2019-10-12 |
| 公開(公告)號: | CN110889045A | 公開(公告)日: | 2020-03-17 |
| 發明(設計)人: | 付昌林;羅瀅川;陳少梅;肖良清;石文富 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06K9/62 |
| 代理公司: | 深圳市沃德知識產權代理事務所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 標簽 分析 方法 裝置 計算機 可讀 存儲 介質 | ||
1.一種基于用戶行為的標簽分析方法,其特征在于,所述方法包括:
接收預先構建的標簽集,采集用戶的原始交互數據集,將所述原始交互數據集進行預處理后得到標準交互數據集;
根據所述標準交互數據集與所述標簽集建立所述用戶的標簽關系;
根據所述標簽關系與預先構建的用戶標簽模型進行相似度計算得到相似度集合;
根據所述相似度集合計算所述標簽關系中的標簽得分,并根據所述標簽得分進行標簽排序得到標簽排序集;
根據預設標簽個數從所述標簽排序集中選擇標簽得到所述用戶的標簽分析結果,并輸出所述標簽分析結果。
2.如權利要求1所述的基于用戶行為的標簽分析方法,其特征在于,所述根據所述標準交互數據集與所述標簽集建立所述待標簽分析用戶的標簽關系,包括:
提取出所述標準交互數據集的關鍵字并進行關鍵字去重處理后得到關鍵字集;
根據所述關鍵字集從所述標簽集提取出與所述關鍵字集相關的標簽得到所述用戶的標簽關系。
3.如權利要求1或2所述的基于用戶行為的標簽分析方法,其特征在于,所述根據所述標簽關系與預先構建的用戶標簽模型進行相似度計算得到相似度集合,包括:
根據所述標簽關系與所述預先構建的用戶標簽模型建立用戶-標簽二部圖;
根據所述用戶-標簽二部圖計算用戶相似度及標簽相似度;
將所述用戶相似度與所述標簽相似度按照用戶與標簽的對應關系計算得到所述相似度集合。
4.如權利要求3所述的基于用戶行為的標簽分析方法,其特征在于,所述用戶相似度的計算方法為:
其中,Sm+1(u,u’)表示所述用戶相似度,u為所述用戶的交互數據,u’為所述用戶標簽模型中的交互數據,m為迭代次數,Trust(u,u’)為u,u’的信任度,O(u)表示所述待標簽分析用戶標簽集合,O(u’)表示所述用戶標簽模型中的用戶u’的標簽集合,Sm+1(Oi(u),Oj(u’))表示所述待標簽分析用戶的標簽i與所述用戶標簽模型中的用戶u’的標簽j的相似度,C1為介于[0,1]之間的常數;
所述標簽相似度為:
其中,Sm+1(t,t’)表示所述待標簽分析用戶的標簽t與所述用戶標簽模型中的標簽t’的標簽相似度,I(t)表示所述標簽t的相似標簽集合,I(t’)表示所述標簽t’的相似標簽集合,Sm+1(Ii(t),Ij(t’))表示所述標簽t的相似標簽集合i與所述標簽t’的相似標簽集合j的相似度,C2為介于[0,1]之間的常數。
5.如權利要求1所述的基于用戶行為的標簽分析方法,其特征在于,所述根據所述相似度集合計算所述標簽關系中的標簽得分的方法為:
其中,rS(u,t)表示所述標簽得分,S(u,t)表示所述相似度集合,u為所述用戶的交互數據,t的所述用戶的標簽,u’為所述用戶標簽模型中的交互數據,為所述用戶標簽模型的用戶總量,為所述用戶標簽模型的標簽總量,表示所述用戶標簽模型的用戶與所述待標簽分析用戶的相似度,ru,t表示所述待標簽分析用戶與所述待標簽分析用戶的標簽的過濾值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910975812.0/1.html,轉載請聲明來源鉆瓜專利網。





