[發明專利]一種基于梯度提升樹的慕課論壇主題分類方法在審
| 申請號: | 201810537535.0 | 申請日: | 2018-05-30 |
| 公開(公告)號: | CN108829776A | 公開(公告)日: | 2018-11-16 |
| 發明(設計)人: | 王飛龍;馮林;盧惠民 | 申請(專利權)人: | 大連理工大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 大連星海專利事務所有限公司 21208 | 代理人: | 裴毓英 |
| 地址: | 116024 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 主題分類 用戶行為特征 論壇用戶 組合特征 論壇 方法使用 邏輯回歸 人工篩選 人工設計 先驗知識 行為數據 行為特征 用戶行為 融合 分類器 熱編碼 準確率 樣本 分類 記錄 | ||
1.一種基于梯度提升樹的慕課論壇主題分類方法,包括以下步驟:
步驟S101:收集并記錄慕課論壇用戶的行為數據,設計并提取慕課論壇用戶的行為特征;通過提取與文本信息無關的慕課論壇用戶行為特征,獲得不同論壇板塊下主題的交互特點;
步驟S102:根據不同論壇主題的特點,使用梯度提升樹對用戶特征進行融合,得到判別能力更強的組合特征;
步驟S103:使用獨熱編碼對組合特征進行編碼,將編碼結果作為樣本的特征表示,使用邏輯回歸分類器和新特征實現對論壇主題的有效分類。
2.根據權利要求1所述基于梯度提升樹的慕課論壇主題分類方法,其特征在于,所述步驟S102,根據不同論壇主題的特點,使用梯度提升樹對用戶行為特征進行融合,得到判別能力更強的組合特征。
3.根據權利要求2所述基于梯度提升樹的慕課論壇主題分類方法,其特征在于,利用梯度提升樹發現有區分性的特征和組合特征,通過前一個強學習器的損失函數的負梯度來指導下一個基學習器的訓練,從而不斷提高組合而成的強學習器的分類性能;
設最終訓練得到的最優學習器估計為F*(x),則F*(x)滿足如下公式:
其中xi,yi是第i個樣本的特征和標簽,L是損失函數,F(x)是多個基學習器組合的強學習器,組合規則如下:
h(x;θm)是第m個基學習器,θm是基學習器的參數,βm是基學習器的權重;通過不斷迭代優化得到強學習器。
4.根據權利要求3所述基于梯度提升樹的慕課論壇主題分類方法,其特征在于,所述步驟S103:使用獨熱編碼對組合特征進行編碼,將編碼結果作為樣本的特征表示,使用邏輯回歸分類器和新特征實現對慕課論壇主題的有效分類。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連理工大學,未經大連理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810537535.0/1.html,轉載請聲明來源鉆瓜專利網。





