[發明專利]標簽的粒度屬性識別方法及裝置在審
| 申請號: | 201710581113.9 | 申請日: | 2017-07-17 |
| 公開(公告)號: | CN107451216A | 公開(公告)日: | 2017-12-08 |
| 發明(設計)人: | 晉彤 | 申請(專利權)人: | 廣州特道信息科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 廣州三環專利商標代理有限公司44202 | 代理人: | 梁順宜,郝傳鑫 |
| 地址: | 510000 廣東省廣州市越秀*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 標簽 粒度 屬性 識別 方法 裝置 | ||
技術領域
本發明涉及計算機領域,尤其涉及一種標簽的粒度屬性識別及裝置。
背景技術
隨著互聯網的迅猛發展,每天有大量網頁在互聯網上更新或者發布。對于廣大用戶來說在大量的信息中想找到自己滿意的信息已經是越來越困難,從而導致了“信息過量”與“信息饑餓”的矛盾現象。為解決這一問題,提出了個性化信息服務,這是一種智能信息服務方式。可以根據用戶的信息需求和個性化模式,主動搜尋相關信息,并且利用在線智能推薦服務或者推送技術,準確的將用戶所需的信息傳送到相應的用戶。在個性化服務技術中,應用較成功的是協同過濾方法。該方法是指用戶根據自身的需求,通過和其他用戶進行合作,形成一定的協作規則,或利用多個信息使用者的傾向性來預測單個用戶的興趣,然后根據具有相同興趣愛好的用戶對信息進行評價,從而得到推薦結果。由于Web日志中記錄了大量的用戶行為信息,利用Web日志可以為個性化服務提供重要的數據支持。另外,在用戶興趣度量方面,目前存在的從訪問日志文件中提取用戶的訪問模式進行推薦的方法,沒有考慮到用戶訪問頁面的時間特性。另一方面,現有的推薦系統缺少對文章的粒度分析,從而不能為用戶推薦符合用戶精準需求的資訊。
發明內容
本發明實施例的目的是提供一種標簽的粒度屬性識別方法及裝置,能有效解決現有推薦系統缺少對文章的粒度分析,能為用戶推薦更符合用戶閱讀層級的資訊。
為實現上述目的,本發明實施例提供了一種標簽的粒度屬性識別方法,包括步驟:
收集若干個標簽生成標簽庫,根據所述標簽庫中的全部標簽建立結構化的標簽樹,根據所述標簽樹對所述標簽庫中的每一標簽進行粒度劃分;
識別所述標簽庫中每一標簽在大量文章中的特征,實時收集用戶的行為日志,根據所述標簽庫中每一標簽在大量文章中的特征,對所述行為日志指向的資訊進行標簽抽取生成標簽集;
根據所述標簽庫中每一所標簽的粒度屬性,獲得所述用戶的標簽集中每一標簽的粒度屬性。
與現有技術相比,本發明公開的標簽的粒度屬性識別方法通過收集若干個標簽生成標簽庫,根據所述標簽庫中的全部標簽建立結構化的標簽樹,根據所述標簽樹對所述標簽庫中的每一標簽進行粒度劃分,再識別所述標簽庫中每一標簽在大量文章中的特征,實時收集用戶的行為日志,根據所述標簽庫中每一標簽在大量文章中的特征,對所述行為日志指向的資訊進行標簽抽取生成標簽集,然后根據所述標簽庫中每一所標簽的粒度屬性,獲得所述用戶的標簽集中每一標簽的粒度屬性,能有效解決現有推薦系統缺少對文章的粒度分析,能為用戶推薦更符合用戶閱讀層級的資訊。
作為上述方案的改進,所述標簽的粒度屬性識別方法還包括步驟:
根據獲取到的用戶的標簽集中每一標簽的粒度屬性,向用戶推薦相應粒度屬性的文章。
作為上述方案的改進,所述根據所述標簽樹對所述標簽庫中的每一標簽進行粒度劃分具體為:
通過LDA模型對所述標簽庫中的每一標簽進行粒度劃分。
本發明實施例還提供了一種標簽的粒度屬性識別裝置,包括:
標簽庫生成模塊,用于收集若干個標簽生成標簽庫,根據所述標簽庫中的全部標簽建立結構化的標簽樹,根據所述標簽樹對所述標簽庫中的每一標簽進行粒度劃分;
標簽集生成模塊,用于識別所述標簽庫中每一標簽在大量文章中的特征,實時收集用戶的行為日志,根據所述標簽庫中每一標簽在大量文章中的特征,對所述行為日志指向的資訊進行標簽抽取生成標簽集;
粒度屬性獲取模塊,用于根據所述標簽庫中每一所標簽的粒度屬性,獲得所述用戶的標簽集中每一標簽的粒度屬性。
與現有技術相比,本發明公開的標簽的粒度屬性識別裝置通過標簽庫生成模塊收集若干個標簽生成標簽庫,根據所述標簽庫中的全部標簽建立結構化的標簽樹,根據所述標簽樹對所述標簽庫中的每一標簽進行粒度劃分,再通過標簽集生成模塊識別所述標簽庫中每一標簽在大量文章中的特征,實時收集用戶的行為日志,然后通過粒度屬性獲取模塊根據所述標簽庫中每一標簽在大量文章中的特征,對所述行為日志指向的資訊進行標簽抽取生成標簽集,然后根據所述標簽庫中每一所標簽的粒度屬性,獲得所述用戶的標簽集中每一標簽的粒度屬性,能有效解決現有推薦系統缺少對文章的粒度分析,能為用戶推薦更符合用戶閱讀層級的資訊。
作為上述方案的改進,所述標簽庫生成模塊進一步用于通過LDA模型對所述標簽庫中的每一標簽進行粒度劃分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州特道信息科技有限公司,未經廣州特道信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710581113.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:特征文本抽取方法及裝置
- 下一篇:資訊推薦方法及裝置





