[發(fā)明專利]一種興趣標(biāo)簽推薦方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201210385630.6 | 申請日: | 2012-10-12 |
| 公開(公告)號: | CN103729360A | 公開(公告)日: | 2014-04-16 |
| 發(fā)明(設(shè)計)人: | 賀翔;王業(yè);亓超 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 上海波拓知識產(chǎn)權(quán)代理有限公司 31264 | 代理人: | 楊波 |
| 地址: | 518044 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 興趣 標(biāo)簽 推薦 方法 系統(tǒng) | ||
1.一種興趣標(biāo)簽推薦方法,包括:
統(tǒng)計存在的興趣標(biāo)簽的特征向量;
根據(jù)存在的興趣標(biāo)簽的特征向量,計算存在的興趣標(biāo)簽與推薦的興趣標(biāo)簽的相似度;
根據(jù)存在的興趣標(biāo)簽與推薦的興趣標(biāo)簽的相似度進行興趣標(biāo)簽的推薦。
2.根據(jù)權(quán)利要求1所述的興趣標(biāo)簽推薦方法,其特征在于,所述統(tǒng)計存在的興趣標(biāo)簽的特征向量步驟包括:提取互聯(lián)網(wǎng)相關(guān)文件中標(biāo)題或正文包含所述興趣標(biāo)簽的所有文章;對包含所述興趣標(biāo)簽的所有文章切詞、提取特征詞,統(tǒng)計特征詞的詞頻;對特征詞進行相關(guān)排序,取一定數(shù)量的詞,作為興趣標(biāo)簽的特征向量。
3.根據(jù)權(quán)利要求1或2所述的興趣標(biāo)簽推薦方法,其特征在于,所述統(tǒng)計存在的興趣標(biāo)簽的特征向量步驟前還包括:準(zhǔn)備興趣標(biāo)簽集,并進行分類;收集互聯(lián)網(wǎng)相關(guān)本文作為語料;確定興趣標(biāo)簽的特征詞詞集。
4.根據(jù)權(quán)利要求3所述的興趣標(biāo)簽推薦方法,其特征在于,所述確定興趣標(biāo)簽的特征詞詞集步驟包括:對語料切詞、統(tǒng)計每個詞的文檔頻率倒數(shù)值,去掉高頻詞、停用詞及低頻詞,將剩下的詞作為特征詞。
5.根據(jù)權(quán)利要求1所述的興趣標(biāo)簽推薦方法,其特征在于,所述計算存在的興趣標(biāo)簽與推薦的興趣標(biāo)簽的相似度步驟后還包括:統(tǒng)計存在的興趣標(biāo)簽與推薦的興趣標(biāo)簽之間的共現(xiàn)關(guān)系,其中,共現(xiàn)關(guān)系是指存在的興趣標(biāo)簽與推薦的興趣標(biāo)簽在同一篇文檔中出現(xiàn)的次數(shù)。
6.根據(jù)權(quán)利要求5所述的興趣標(biāo)簽推薦方法,其特征在于,所述根據(jù)存在的興趣標(biāo)簽與推薦的興趣標(biāo)簽的相似度進行興趣標(biāo)簽的推薦步驟還包括:根據(jù)存在的興趣標(biāo)簽與推薦的興趣標(biāo)簽的共現(xiàn)關(guān)系進行興趣標(biāo)簽的推薦。
7.一種興趣標(biāo)簽推薦系統(tǒng),包括:
特征向量統(tǒng)計模塊:用于統(tǒng)計存在的興趣標(biāo)簽的特征向量;
相似度計算模塊:用于根據(jù)存在的興趣標(biāo)簽的特征向量,計算存在的興趣標(biāo)簽與推薦的興趣標(biāo)簽的相似度;
興趣標(biāo)簽推薦模塊:用于跟據(jù)存在的興趣標(biāo)簽與推薦的興趣標(biāo)簽的相似度進行興趣標(biāo)簽的推薦。
8.根據(jù)權(quán)利要求7所述的興趣標(biāo)簽推薦系統(tǒng),其特征在于,所述特征向量統(tǒng)計模塊統(tǒng)計興趣標(biāo)簽的特征向量具體包括:提取互聯(lián)網(wǎng)相關(guān)文件中標(biāo)題或正文包含所述興趣標(biāo)簽的所有文章;對包含所述興趣標(biāo)簽的所有文章切詞、提取特征詞,統(tǒng)計特征詞的詞頻;對特征詞進行相關(guān)排序,取一定數(shù)量的詞,作為興趣標(biāo)簽的特征向量。
9.根據(jù)權(quán)利要求7或8所述的興趣標(biāo)簽推薦系統(tǒng),其特征在于,所述興趣標(biāo)簽推薦系統(tǒng)還包括:
興趣標(biāo)簽集分類模塊:用于準(zhǔn)備興趣標(biāo)簽集,并進行分類;
語料收集模塊:用于收集互聯(lián)網(wǎng)相關(guān)本文作為語料;
特征詞詞集確定模塊:用于確定興趣標(biāo)簽的特征詞詞集。
10.根據(jù)權(quán)利要求9所述的興趣標(biāo)簽推薦系統(tǒng),其特征在于,所述特征詞詞集確定模塊確定興趣標(biāo)簽的特征詞詞集包括:對語料切詞、統(tǒng)計每個詞的文檔頻率倒數(shù)值,去掉高頻詞、停用詞及低頻詞,將剩下的詞作為特征詞。
11.根據(jù)權(quán)利要求7或8所述的興趣標(biāo)簽推薦系統(tǒng),其特征在于,所述興趣標(biāo)簽推薦系統(tǒng)還包括共現(xiàn)關(guān)系統(tǒng)計模塊,所述共現(xiàn)關(guān)系統(tǒng)計模塊用于統(tǒng)計存在的興趣標(biāo)簽與推薦的興趣標(biāo)簽之間的共現(xiàn)關(guān)系,其中,共現(xiàn)關(guān)系是指存在的興趣標(biāo)簽與推薦的興趣標(biāo)簽在同一篇文檔中出現(xiàn)的次數(shù)。
12.根據(jù)權(quán)利要求11所述的興趣標(biāo)簽推薦系統(tǒng),其特征在于,所述興趣標(biāo)簽推薦模塊還跟據(jù)存在的興趣標(biāo)簽與推薦的興趣標(biāo)簽的共現(xiàn)關(guān)系進行興趣標(biāo)簽的推薦。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210385630.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 興趣點系統(tǒng)、興趣點信息系統(tǒng)以及下載多個興趣點的方法
- 用戶興趣點的確定方法、裝置及終端
- 一種全局興趣探索推薦方法和裝置
- 信息中心聯(lián)網(wǎng)中的跟蹤排隊延遲和執(zhí)行相關(guān)的擁塞控制的方法、裝置及介質(zhì)
- 興趣點重要度測量方法和裝置
- 一種導(dǎo)航方法及系統(tǒng)
- 興趣偏好預(yù)測方法、裝置、計算機設(shè)備及存儲介質(zhì)
- 一種興趣點的質(zhì)量評分獲取方法、裝置、計算機設(shè)備及存儲介質(zhì)
- 聚合興趣點的方法、裝置、設(shè)備和介質(zhì)
- 用于優(yōu)化興趣點標(biāo)簽的方法和裝置





