[發明專利]一種維基百科概念依賴關系識別方法有效
| 申請號: | 202011600680.2 | 申請日: | 2020-12-30 |
| 公開(公告)號: | CN112612897B | 公開(公告)日: | 2023-06-20 |
| 發明(設計)人: | 肖奎;王時繪;張?;婁園園;周洋 | 申請(專利權)人: | 湖北大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/36;G06F18/214;G06N20/20 |
| 代理公司: | 北京眾達德權知識產權代理有限公司 11570 | 代理人: | 劉杰 |
| 地址: | 430062 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 百科 概念 依賴 關系 識別 方法 | ||
本發明提供了一種維基百科概念依賴關系識別方法,包括如下步驟:由至少兩個的基分類器組成Bagging分類器,并由至少兩個Bagging分類器組成的Boosting分類器;用Boosting分類器對數據集進行訓練:樣本經過所有的Bagging分類器后,得到最終的分類結果;輸入測試樣本,Boosting分類器預測當前樣本概念對間的依賴關系;本發明的方法,同時結合Bagging和Boosting兩種集成技術的優點來預測維基百科概念之間的依賴關系,將AdaBoost算法當中的基分類器換成基于Bagging的集成學習分類器,這樣AdaBoost既能發揮自己在權值分配上的優勢,還能結合Bagging算法在樣例選擇上具有隨機獨立的特點,分類結果更為準確。
技術領域
本發明涉及智能分類領域,尤其涉及一種維基百科概念依賴關系識別方法。
背景技術
隨著網絡時代地不斷發展,在線教育資源例如在線課程、視頻和文檔等數量呈現出快速增長的趨勢,但是這些資源往往是由不同人創建而成,因此其中的學習順序關系很難確定,對于自學者而言面對如此繁雜的資料也將無從下手。為了解決該問題,我們將目光集中于基于教育資源的概念圖譜(Concept?Graph?Learning,CGL)中來。一個維基百科概念圖包含從相同課程而來的概念集合,集合中維基百科概念對的邊就代表相互之間的依賴關系。例如“二叉搜索樹”(binary?search?tree)就是“紅黑樹”(red-black?tree)的依賴,換言之就是學習者在理解“紅黑樹”相關知識的時候,需要學習“二叉搜索樹”作為預備知識。因此,概念之間的依賴關系作為維基百科概念圖譜的重要組成部分,可以決定網絡中教育資源的合理學習順序。
在以往地研究中,通常使用單個算法或者學習器或者是由單一類型算法組成的集成學習對維基百科概念間的依賴關系進行研究。
例如隨機森林作為bagging集成學習的代表,其中包含多個決策樹模型幫助分類,但是這其中仍有一些問題需要去解決,模型中各個基學習器的學習過程相互獨立,因此如果某一個基學習器將其中一個樣例誤分,那么將不會對其余基學習判斷產生任何影響。
Boosting算法是另外一種重要的集成學習技術,其主要思想是將弱分類器組裝成一個強分類器。當前實現該技術的最具代表性的方法是AdaBoost算法,該算法在實現上是采用串行迭代訓練模式,通過調整每一輪樣例的訓練權重,使得上一次被錯誤分類的樣例得到重視。AdaBoost算法在實現過程中,每輪訓練仍然采用基本的機器學習分類器如決策樹等,但該算法也存在一定的問題,例如在訓練階段采用的是全部訓練集,因此可能出現每輪訓練出的模型差別不大。
發明內容
本發明提供了一種維基百科概念依賴關系識別方法,同時結合Bagging和Boosting兩種集成技術的優點來預測維基百科概念之間的依賴關系,將AdaBoost算法當中的基分類器換成基于Bagging的集成學習分類器,這樣AdaBoost既能發揮自己在權值分配上的優勢,還能結合Bagging算法在樣例選擇上具有隨機獨立的特點,分類結果更為準確。
一種維基百科概念依賴關系識別方法,其特征在于,包括如下步驟:
由至少兩個的基分類器組成Bagging分類器,并由至少兩個Bagging分類器組成的Boosting分類器;
用Boosting分類器對數據集進行訓練:
前一個Bagging分類器對所有樣本完成預測,前一個Bagging分類器獲取全部的樣本數據后,其中的每個基分類器從樣本中放回式采樣,然后進行訓練;
后一個Bagging分類器觀察前一個分類器,當所有樣本輸入到第二個分類器后,把所有的樣本加上權值,并將前一個Bagging分類器預測錯誤的樣本分配的權值大于預測正確的樣本分配的權值;
樣本經過所有的Bagging分類器后,得到最終的分類結果;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖北大學,未經湖北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011600680.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種手術輔助器械
- 下一篇:一種航路網絡生成方法、裝置及計算機存儲介質





