[發明專利]網絡內容自動推薦方法、裝置和系統有效
| 申請號: | 201310309049.0 | 申請日: | 2013-07-22 |
| 公開(公告)號: | CN103399891A | 公開(公告)日: | 2013-11-20 |
| 發明(設計)人: | 吳先超;陳龍 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網絡 內容 自動 推薦 方法 裝置 系統 | ||
1.一種網絡內容自動推薦方法,其特征在于,包括:
接收網絡文本數據,從接收的網絡文本數據中提取關鍵詞;
利用所述關鍵詞按照增量學習的方式訓練關鍵詞分類器;
接收特定用戶的網絡文本數據,根據所述關鍵詞分類器對從所述特定用戶的網絡文本數據中提取的關鍵詞的分類結果對所述特定用戶進行分類;以及
根據對所述特定用戶的分類,并按照預先定義的網絡內容的分類向特定用戶推薦特定用戶感興趣的網絡內容。
2.根據權利要求1所述的網絡內容自動推薦方法,其特征在于,所述接收網絡文本數據,從接收的網絡文本數據中提取關鍵詞包括:
接收網絡文本數據;
對所述網絡文本數據進行切詞,獲得準關鍵詞;
計算所述準關鍵詞的重要度;以及
將所述準關鍵詞中重要度高于重要度閾值的準關鍵詞作為關鍵詞。
3.根據權利要求2所述的網絡內容自動推薦方法,其特征在于,所述計算所述準關鍵詞的重要度是根據詞頻-逆向文檔頻率(term?frequency-inverse?document?frequency,TF-IDF)算法計算所述準關鍵詞的重要度。
4.根據權利要求1所述的網絡內容自動推薦方法,其特征在于,所述利用所述關鍵詞按照增量學習的方式訓練關鍵詞分類器是利用所述關鍵詞按照半監督學習的方式訓練關鍵詞分類器。
5.根據權利要求4所述的網絡內容自動推薦方法,其特征在于,所述利用所述關鍵詞按照半監督學習的方式訓練關鍵詞分類器是利用已分類關鍵詞通過半監督學習算法對新提取的未分類關鍵詞進行分類。
6.根據權利要求1所述的網絡內容自動推薦方法,其特征在于,所述接收特定用戶的網絡文本數據,根據所述關鍵詞分類器對從所述特定用戶的網絡文本數據中提取的關鍵詞的分類結果對所述特定用戶進行分類包括:
接收特定用戶的網絡文本數據;
統計每個類別的關鍵詞在所述特定用戶的網絡文本數據中出現的次數;以及
將關鍵詞在所述特定用戶的網絡文本數據中出現次數最多的至少兩個類別設置為所述特定用戶的類別。
7.根據權利要求1所述的網絡內容自動推薦方法,其特征在于,所述根據對所述特定用戶的分類,并按照預先定義的網絡內容的分類向特定用戶推薦特定用戶感興趣的網絡內容包括:
統計每個類別中各網絡內容被訪問的次數;以及
將每個類別中被訪問次數最高的至少兩個網絡內容推薦給用戶。
8.根據權利要求1所述的網絡內容自動推薦方法,其特征在于,所述網絡文本數據包括所有用戶瀏覽的網頁上的文本、所有用戶在即時通訊工具中輸入的文本和所有用戶在社交網絡站點上輸入的文本;所述特定用戶的網絡文本數據包括所述特定用戶瀏覽的網頁上的文本、特定用戶在即時通訊工具中輸入的文本和特定用戶在社交網絡站點上輸入的文本。
9.一種網絡內容自動推薦裝置,其特征在于,包括:
關鍵詞提取模塊,用于接收網絡文本數據,從接收的網絡文本數據中提取關鍵詞;
關鍵詞分類器訓練模塊,用于利用所述關鍵詞按照增量學習的方式訓練關鍵詞分類器;
特定用戶分類模塊,用于接收特定用戶的網絡文本數據,根據所述關鍵詞分類器對從所述特定用戶的網絡文本數據中提取的關鍵詞的分類結果對所述特定用戶進行分類;以及
網絡內容推薦模塊,用于根據對所述特定用戶的分類,并按照預先定義的網絡內容的分類向特定用戶推薦特定用戶感興趣的網絡內容。
10.根據權利要求9所述的網絡內容自動推薦裝置,其特征在于,所述關鍵詞提取模塊包括:
第一文本數據接收子模塊,用于接收網絡文本數據;
文本切詞子模塊,用于對所述網絡文本數據進行切詞,獲得準關鍵詞;
重要度計算子模塊,用于計算所述準關鍵詞的重要度;以及
關鍵詞獲取子模塊,用于將所述準關鍵詞中重要度高于重要度閾值的準關鍵詞作為關鍵詞。
11.根據權利要求10所述的網絡內容自動推薦裝置,其特征在于,所述重要度計算子模塊根據詞頻-逆向文檔頻率(term?frequency-inverse?document?frequency,TF-IDF)算法計算所述準關鍵詞的重要度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310309049.0/1.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





