[發明專利]一種為用戶生成標簽的方法和裝置有效
| 申請號: | 201210015741.8 | 申請日: | 2012-01-18 |
| 公開(公告)號: | CN103218355A | 公開(公告)日: | 2013-07-24 |
| 發明(設計)人: | 席曉鳴 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京德琦知識產權代理有限公司 11018 | 代理人: | 謝安昆;宋志強 |
| 地址: | 518044 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用戶 生成 標簽 方法 裝置 | ||
技術領域
本發明涉及網絡技術,特別涉及一種為用戶生成標簽的方法和裝置。
背景技術
現有技術中,可根據從文章中提取出的關鍵詞來為文章生成標簽(Tag),從而使得閱讀者能夠方便快捷地了解到文章的內容等。
相應地,也希望能夠為用戶生成標簽,以便方便快捷地獲取到用戶的個性化信息,從而更好地為其提供服務,如根據用戶的標簽為其推送可能感興趣的信息等。
但現有技術中還沒有一種能夠為用戶生成標簽的方式。
發明內容
有鑒于此,本發明提供一種為用戶生成標簽的方法和裝置,從而能夠方便快捷地獲取到用戶的個性化信息。
為達到上述目的,本發明的技術方案是這樣實現的:
一種為用戶生成標簽的方法,包括:
針對任一用戶X,實時獲取其登錄網絡后的操作行為信息,并在當每獲取到一條操作行為信息后,則進行一次以下處理:
提取該操作行為信息中的關鍵詞,并進行保存;
從所保存的所有關鍵詞中選出符合要求的關鍵詞,作為用戶X的標簽。
一種為用戶生成標簽的裝置,包括:
獲取模塊,用于針對任一用戶X,實時獲取其登錄網絡后的操作行為信息,并將獲取到的各條操作行為信息發送給處理模塊;
所述處理模塊,用于在每接收到一條操作行為信息后,則進行一次以下處理:提取該操作行為信息中的關鍵詞,并進行保存;從所保存的所有關鍵詞中選出符合要求的關鍵詞,作為用戶X的標簽。
可見,采用本發明所述方案,通過為用戶生成標簽,能夠方便快捷地獲取到用戶的個性化信息,從而能夠更好地為用戶提供服務;而且,本發明所述方案實現起來簡單方便,便于普及和推廣。
附圖說明
圖1為本發明為用戶生成標簽的方法實施例的流程圖。
圖2為用戶X訂閱某一信息的示意圖。
圖3為用戶X分享某一信息的示意圖。
圖4為本發明為用戶生成標簽的裝置實施例的組成結構示意圖。
具體實施方式
針對現有技術中存在的問題,本發明中提出一種為用戶生成標簽的方案。
為使本發明的技術方案更加清楚、明白,以下參照附圖并舉實施例,對本發明所述方案作進一步地詳細說明。
圖1為本發明為用戶生成標簽的方法實施例的流程圖。如圖1所示,包括以下步驟:
步驟11:針對任一用戶X,實時獲取其登錄網絡后的操作行為信息。
為表述方便,用用戶X來代表任一用戶,針對任一用戶,均可按照本發明所述方式進行處理。
用戶X登錄網絡后,會進行各種操作行為,如點擊訂閱了某一信息、分享了某一信息,或關注了某一信息等,在實際應用中,可實時獲取用戶X的操作行為信息。
圖2為用戶X訂閱某一信息的示意圖;圖3為用戶X分享某一信息的示意圖。如圖2~3所示,用戶X可通過點擊“訂閱本欄目”和“分享給好友”按鈕來訂閱和分享相應的信息。
步驟12:當每獲取到一條操作行為信息后,則進行一次以下處理:提取該操作行為信息中的關鍵詞,并進行保存;從所保存的所有關鍵詞中選出符合要求的關鍵詞,作為用戶X的標簽。
本發明中,每獲取到一條操作行為信息,則生成一次標簽,并利用新生成的標簽來對之前所生成的標簽進行更新。
具體來說,本步驟中,針對獲取到的每條操作行為信息,可分別進行如下處理:
1)提取該操作行為信息中的關鍵詞,并進行保存。
具體的可采用詞頻(TF,Term?Frequency)*逆向文件詞頻(IDF,Inverse?Document?Frequency)的關鍵詞提取方式。
其中,TF是指在一份給定的文件中,某一個給定的詞語在該文件中出現的次數,并可根據文件長度進行歸一化;IDF用于衡量一個詞語的普遍重要性,某一給定詞語的IDF可由總文件數除以包含該詞語的文件數的商再取對數得到;具體到本實施例中,一條信息即可看成是一個文件,提取TF*IDF分值較高的詞語作為關鍵詞。
為此,需要保存獲取到的每條操作行為信息,同樣,需要保存提取出的每條操作行為信息的關鍵詞。
在實際應用中,也可以采用其它關鍵詞提取方式,比如,基于N元文法(N-Gram)信息統計的關鍵詞提取方式等。
2)從所保存的所有關鍵詞中選出符合要求的關鍵詞,作為用戶X的標簽。
具體來說,可分別確定所保存的各關鍵詞的權重,并按照權重由大到小的順序進行排序,將排序后處于前N位的關鍵詞作為用戶X的標簽,N為大于1的正整數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210015741.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:具有可控排出的斷路器
- 下一篇:一種生物除鐵除錳濾池工藝的快速恢復方法





