[發明專利]網絡標簽自動識別方法及其系統有效
| 申請號: | 201210140186.1 | 申請日: | 2012-05-08 |
| 公開(公告)號: | CN103389981B | 公開(公告)日: | 2018-01-05 |
| 發明(設計)人: | 鄒維;曹越;楊俊松;趙雋;柳睿 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司44224 | 代理人: | 王茹,黃曉慶 |
| 地址: | 518044 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網絡 標簽 自動識別 方法 及其 系統 | ||
技術領域
本發明涉及網絡標簽識別的技術領域,特別是涉及一種網絡標簽自動識別方法,以及一種網絡標簽自動識別系統。
背景技術
通常在各種網絡通信系統中,用戶常常通過簽名的方式對自己的心情,興趣等進行簡要的介紹,因此在簽名中會帶有各種不同的網絡標簽,例如用戶在描述興趣的一欄添加的網絡標簽可能有“電影”、“旅游”等標簽。
隨著用戶畫像在數據挖掘技術的推動下得到越來越廣的應用,在獲得用戶興趣標簽屬性后,我們可以根據標簽推薦用戶喜歡的日志、微博、游戲等,還可以根據用戶的標簽進行精準的廣告投放,同時在基于用戶興趣標簽的陌生交友方面,也有很重要的應用意義。例如各個網絡運營商通常會根據各個用戶的網絡標簽,為用戶查找具有相同興趣的其他用戶,或者推薦用戶可能感興趣的各種產品、服務等。
然而,對各個網絡標簽的分類不準確有可能導致推薦信息的混亂,例如在用戶喜愛的一欄可能帶有“蘋果”標簽,而“蘋果”標簽有可能是指一種水果,也可能是指一個電子產品的品牌。因此,無法根據“蘋果”這一標簽,為用戶準確地進行信息推薦。如果用戶添加的標簽代表水果,而向用戶推薦電子產品相關的信息,就會達不到目的,影響用戶的體驗。
發明內容
本發明的目的在于提供一種網絡標簽自動識別方法,通過對標簽的來源文件進行文本搜索,根據搜索確定的特征詞準確識別網絡標簽的分類,解決背景技術中對網絡標簽的識別不準確的問題,據此能夠對用戶進行準確的廣告投放和業務推薦等操作,提高用戶體驗。
一種網絡標簽自動識別方法,包括以下步驟:
輸入用戶的待識別標簽;
判斷所述待識別標簽對應的標簽分類是否多于一個;
如果所述待識別標簽對應的標簽分類只有一個,則將所述待識別標簽直接劃分至對應的標簽分類;
如果所述待識別標簽對應的標簽分類多于一個,則在記載所述待識別標簽的源文本中搜索與各個所述標簽分類相關的特征詞;
根據所述特征詞識別所述待識別標簽的標簽分類;
如果根據所述特征詞不能識別所述待識別標簽的標簽分類,則進一步獲取該用戶的用戶信息,所述用戶信息包括用戶的屬性和用戶的已有標簽;根據所述用戶信息進行用戶關聯性搜索,查找出具有與所述待識別標簽相同的標簽并且與該用戶關聯性最高的其他用戶;
將所述其他用戶已有的相同標簽的標簽分類識別為所述待識別標簽的標簽分類。
針對上述背景技術中存在的問題,本發明的目的還在于提供一種網絡標簽自動識別系統。
一種網絡標簽自動識別系統,包括:
標簽輸入模塊,用于輸入用戶的待識別標簽;
第一判斷模塊,判斷所述待識別標簽對應的標簽分類是否多于一個;
第一分類模塊,用于在所述待識別標簽對應的標簽分類只有一個時,將所述待識別標簽直接劃分至對應的標簽分類;
文本解析模塊,用于在所述待識別標簽對應的標簽分類多于一個時,在記載所述待識別標簽的源文本中搜索與各個所述標簽分類相關的特征詞;
第二分類模塊,用于根據所述特征詞識別所述待識別標簽的標簽分類;
用戶關聯模塊,用于在所述第二分類模塊不能識別所述待識別標簽的標簽分類時,獲取該用戶的用戶信息,所述用戶信息包括用戶的屬性和用戶的已有標簽;根據所述用戶信息進行用戶關聯性搜索,查找出具有與所述待識別標簽相同的標簽并且與該用戶關聯性最高的其他用戶;
第三分類模塊,用于將所述其他用戶已有的相同標簽的標簽分類識別為所述待識別標簽的標簽分類。
本發明的網絡標簽自動識別方法及其系統中,首先判斷用戶輸入的網絡標簽是否有歧義,即對應多于一個的標簽分類,如果是,則在記載所述待識別標簽的源文本中搜索與各個所述標簽分類相關的特征詞,然后將所述特征詞對應的標簽分類識別為所述待識別標簽的標簽分類。因此可以通過所述待識別標簽的源文本中的其他特征詞準確地識別所述標簽所屬的標簽分類,據此能夠對用戶進行準確的廣告投放和業務推薦等操作,提高用戶體驗。
附圖說明
圖1是本發明網絡標簽自動識別方法的一個實施方式的流程示意圖;
圖2是本發明網絡標簽自動識別方法的第二個實施方式的流程示意圖;
圖3是本發明網絡標簽自動識別方法的第三個實施方式的流程示意圖;
圖4是本發明網絡標簽自動識別系統的一個實施方式的結構示意圖;
圖5是本發明網絡標簽自動識別系統的第二個實施方式的結構示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210140186.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種油水井自生泡沫解堵劑及解堵工藝
- 下一篇:堵漏劑及其制備方法





