[發明專利]一種基于分類決策樹的內容發布智能分類方法在審
| 申請號: | 201510021030.5 | 申請日: | 2015-01-16 |
| 公開(公告)號: | CN104657422A | 公開(公告)日: | 2015-05-27 |
| 發明(設計)人: | 蘇森;徐鵬;雙鍇;溫鑒榮;王玉龍 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京思創畢升專利事務所 11218 | 代理人: | 郭韞 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 分類 決策樹 內容 發布 智能 方法 | ||
本發明提供了一種基于分類決策樹的內容發布智能分類方法,屬于內容管理系統和數據挖掘領域。所述方法應用的系統通用架構包括:內容數據采集模塊、分類策略模塊、分類決策樹訓練模塊;所述方法結合機器學習的監督學習方法,將內容管理系統中已有的內容信息作為訓練數據集合,并利用此訓練數據集合基于決策樹學習算法生成分類器;所有發布內容都基于相同的發布途徑,發布后由所述分類器根據發布內容的特征值判斷該發布內容的類型,從而完成整個發布過程。本發明改善了內容發布的用戶體驗。發布后內容的類別由系統判斷,而非用戶選擇,發布流程更加智能化。
技術領域
本發明屬于內容管理系統(Content Management System)和數據挖掘(DataMining)領域,具體涉及一種基于分類決策樹的內容發布智能分類方法,應用于并革新內容發布流程的智能分類機制,基于現有內容信息生成的分類決策樹配置信息,以實現自動對用戶新發布的內容進行智能分類,從而在保證效率的前提下改善用戶進行內容發布的體驗。
背景技術
隨著互聯網的廣泛普及尤其是社交化網絡的快速發展,網絡信息不僅在量上呈爆炸性的增長,而且內容的類型亦更加的豐富。對于一個企業、組織、或者一個廣義上的社交分享平臺而言,內容管理有了新的挑戰,比如內容的存儲、分類,檢索等等。而本發明關注內容管理的發布流程的改善。在傳統的多類型內容管理系統中,針對不同類型內容,比如文章、鏈接、視頻、文檔等,它們各自的內容發布流程時往往是被顯性進行區分,即每一種類型都各有其特殊的發布流程,以人人網(http://www.renren.com)為例,日志、鏈接分享、狀態等內容的發布途徑是不同的。同時,隨著智能終端的快速發展,一個應用的訪問形式不僅僅只有傳統的web形式,還有移動app形式。因此,一個體驗良好而且統一的內容發布流程成為了內容管理系統中內容發布部分發展的趨勢。
在傳統的內容發布流程中,不同類型的內容發布基于不同的發布途徑或過程。這些不同的發布途徑,帶來了許多的不便:1)從前端體驗的角度看,用戶需手動選擇內容類型,同時頁面需要為所有類型的內容發布提供入口鏈接;類型越多,所需要的屏幕空間越大,這點在移動智能終端上影響尤其大。2)從工程實踐的角度看,為不同類型的內容提供特殊化的發布流程,架構的擴展性差,每增加一類內容,便要增加相應的代碼,同時不同類型的內容發布流程的業務邏輯基本相似,容易造成代碼冗余。
分類是一種數據分析形式,也是數據挖掘中一項非常重要的任務(可參考李彥華.決策樹分類器的研究、實現及在數據挖掘中的應用[D].上海交通大學,2001.以及黃澤宇.決策樹分類器算法的研究[D].北京交通大學,2006.)。它可用于在數據中抽取出決策支持所用的知識,即能在數據中抽取出描述重要數據集合或預測未來數據趨勢的模型。在數據挖掘中,分類的應用非常廣泛。例如銷售部門可以在收集的客戶資料上建立一個分類模型,來判斷客戶是潛在客戶還是忠實客戶。而在本場景下,可以基于現有的內容類型的信息,建立分類模型,來判斷新發布內容的類型。
一般地,分類是依據某種分類模型,在具有類別信息的數據集合中學習出一個分類函數,即分類器。分類器能夠基于特征值集合所描述的待分類實例指派一個最適合的類別,從而能夠應用于數據分類和預測。
從機器學習方法中監督學習和非監督學習兩類方法看,分類器的學習策略還分為急切式學習策略和懶惰式學習策略。前者在分類器訓練過程中就建立能將待分類實例映射到具體類別的有清晰假設的分類器,然后隨著訓練改善分類器;而后者在訓練過程中沒有建立清晰的假設,分類過程即是利用訓練集合將給定實例與其類別匹配起來的過程。一般來說,急切式學習策略在效率上大大優于懶惰式學習策略,然而后者在分類精確度上優于急切式學習策略。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510021030.5/2.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





