[發明專利]一種基于分類決策樹的內容發布智能分類方法在審
| 申請號: | 201510021030.5 | 申請日: | 2015-01-16 |
| 公開(公告)號: | CN104657422A | 公開(公告)日: | 2015-05-27 |
| 發明(設計)人: | 蘇森;徐鵬;雙鍇;溫鑒榮;王玉龍 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京思創畢升專利事務所 11218 | 代理人: | 郭韞 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 分類 決策樹 內容 發布 智能 方法 | ||
1.一種基于分類決策樹的內容發布智能分類方法,所述方法應用的系統通用架構包括:內容數據采集模塊、分類策略模塊、分類決策樹訓練模塊;其特征在于:所述方法結合機器學習的監督學習方法,將內容管理系統中已有的內容信息作為訓練數據集合,并利用此訓練數據集合基于決策樹學習算法生成分類器;所有發布內容都基于相同的發布途徑,發布后由所述分類器根據發布內容的特征值判斷該發布內容的類型,從而完成整個發布過程,
所述方法進一步包括內容發布步驟,具體如下:
(B1)基于統一的頁面進行內容發布提交;
(B2)提取特征值:根據用戶提供的內容信息提取特征值信息;
(B3)分類器根據步驟(B2)得到的特征值信息判斷新發布內容的類型;
(B4)將步驟(B3)判斷出的類別的信息存于內容信息數據中,然后存于數據庫中。
2.根據權利要求1所述的基于分類決策樹的內容發布智能分類方法,其特征在于:所述方法利用所述內容數據采集模塊分析新發布內容的特征值信息;利用分類策略模塊加載分類決策樹配置信息,以及在其運行過程中根據提供的特征值信息返回類型信息;利用分類決策樹訓練模塊基于所述訓練數據集合進行離線處理,輸出決策樹配置信息,形成所述分類器;
所述特征值信息包括:文本長度、是否包含鏈接、是否包含文檔附件、是否包含視頻鏈接和是否包含圖片;
發布內容的類型包括:文檔、話題、文章、分享鏈接和視頻。
3.根據權利要求2所述的基于分類決策樹的內容發布智能分類方法,其特征在于:所述方法包括分類決策樹訓練步驟,具體如下:
(A1)對內容管理系統中已有的內容信息進行預處理,提取所需的特征值信息和類型信息,取1成作為驗證數據,9成作為訓練數據;
(A2)基于決策樹學習算法和算法參數,生成分類決策樹配置信息;
(A3)基于所述驗證數據,對步驟(A2)生成的決策樹配置信息進行測試,輸出測試結果;
(A4)輸出分類器。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510021030.5/1.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





