[發明專利]一種基于社交網絡的用戶興趣標簽構建方法及相關設備有效
| 申請號: | 201910136403.1 | 申請日: | 2019-02-25 |
| 公開(公告)號: | CN109992723B | 公開(公告)日: | 2023-06-20 |
| 發明(設計)人: | 黃博;畢野;吳振宇;王建明 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06F40/289;G06Q50/00 |
| 代理公司: | 北京市京大律師事務所 11321 | 代理人: | 謝文強 |
| 地址: | 518033 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 社交 網絡 用戶 興趣 標簽 構建 方法 相關 設備 | ||
1.一種基于社交網絡的用戶興趣標簽構建方法,其特征在于,包括:
獲取VIP用戶的認證信息,將所述認證信息生成多個獨立句子,調用結巴分詞系統識別多個所述獨立句子,生成興趣標簽;
獲取粉絲用戶和所述VIP用戶的互動數據,計算所述興趣標簽對粉絲用戶的興趣權重;
依據所述粉絲用戶的興趣權重,計算所述粉絲用戶的興趣得分;
遍歷所述粉絲用戶關注的所有VIP用戶,生成所述粉絲用戶的興趣得分矩陣;
依據所述粉絲用戶的興趣得分矩陣,更新所述粉絲用戶的興趣標簽;
所述獲取粉絲用戶和所述VIP用戶的互動數據,計算所述興趣標簽對粉絲用戶的興趣權重,包括:
通過爬蟲功能腳本爬取第i個所述粉絲用戶與第j個所述VIP用戶的互動數據,提取所述粉絲用戶對所述VIP用戶單向互動的數據并定義為單向互動指數,依據所述互動數據計算第i個所述粉絲用戶對第j個所述VIP用戶的興趣權重Wij,其中,i表示所述粉絲用戶編號,j表示所述VIP用戶編號,當所述粉絲用戶對所述VIP用戶為單向關注時,所述興趣權重Wij采用的計算公式為:
其中,Sq是單項互動值,為預設時間內第i個所述粉絲用戶對第j個所述VIP用戶的所述互動數據中單項互動指數求和得到,Sq'是單項總互動值,為預設時間內第i個所述粉絲用戶對所有VIP用戶的所述互動數據中單項互動指數求和得到,n是互動的種類數量;
所述獲取粉絲用戶和所述VIP用戶的互動數據,計算所述興趣標簽對粉絲用戶的興趣權重,還包括:
當第i個所述粉絲用戶與第j個所述VIP相互關注時,調整所述興趣權重Wij得到調整的興趣權重Wij',調整的興趣權重Wij'采用的計算公式為:
Wij'=Wij×log(1+Rji)
其中,Sp是單項互動值,為預設時間內第j個所述VIP用戶對第i個所述粉絲用戶的所述互動數據中單項互動指數求和得到,Sp'是單項總互動值,為第j個所述VIP用戶對自身關注的所有VIP用戶的所述互動數據中單項互動指數求和得到;
所述依據所述粉絲用戶的興趣權重,計算所述粉絲用戶的興趣得分,包括:
當所述粉絲用戶對所述VIP用戶為單向關注時,興趣得分計算公式為:
Sum=Wij×λ×m
當所述粉絲用戶與所述VIP用戶為互相關注時,興趣得分計算公式為:
Sum=Wij'×λ×m
其中,Wij為計算的興趣權重,Wij'為調整的興趣權重,λ為權重系數,m為粉絲用戶與VIP用戶相互互動的次數,Sum為粉絲用戶最后的興趣得分。
2.如權利要求1所述的一種基于社交網絡的用戶興趣標簽構建方法,其特征在于,所述獲取VIP用戶的認證信息,將所述認證信息生成多個獨立句子,調用結巴分詞系統識別多個所述獨立句子,生成興趣標簽,包括:
通過預設的爬蟲功能腳本,爬取VIP用戶的認證信息;
將所述認證信息匯總到同一文本文件中,通過正則表達式讀取所述文本文件中的標點符號,以標點符號將所述文本文件切分成多個獨立句子;
調用結巴分詞系統,依據預設的結巴分詞參數將所述獨立句子進行全模式分詞獲取多個詞語,通過隱馬爾可夫模型識別多個所述詞語中的關鍵詞,將所述關鍵詞生成興趣標簽。
3.如權利要求1所述的一種基于社交網絡的用戶興趣標簽構建方法,其特征在于,所述遍歷所述粉絲用戶關注的所有VIP用戶,生成所述粉絲用戶的興趣得分矩陣,包括:
便歷所述粉絲用戶關注的所有VIP用戶,獲取所述粉絲用戶關注的所有VIP用戶的興趣得分;
依據所述興趣得分,生成所述粉絲用戶的興趣得分矩陣S?ik,其中i表示粉絲用戶,k表示興趣標簽。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910136403.1/1.html,轉載請聲明來源鉆瓜專利網。





