[發明專利]一種基于決策樹的數據庫本體學習優化方法在審
| 申請號: | 201910588441.0 | 申請日: | 2019-07-01 |
| 公開(公告)號: | CN110377754A | 公開(公告)日: | 2019-10-25 |
| 發明(設計)人: | 劉秀磊;丁嘉偉;劉旭紅;張良;曹建制 | 申請(專利權)人: | 北京信息科技大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35;G06F16/28;G06K9/62 |
| 代理公司: | 北京青松知識產權代理事務所(特殊普通合伙) 11384 | 代理人: | 鄭青松 |
| 地址: | 100089 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 決策樹 源數據 讀取 數據庫本體 語言構建 屬性表 數據庫 學習 決策樹算法 數據庫生成 人力成本 有效表示 預設算法 約束規則 最終決策 構建 填充 優化 存儲 分類 發現 | ||
1.一種基于決策樹的數據庫本體學習優化方法,其特征在于,包括以下步驟:
確定待分類的源數據屬性表;
利用預設算法對所述源數據屬性表進行訓練,生成屬性決策樹;
基于生成的屬性決策樹,使用OWL本體語言構建源數據本體,讀取數據庫表字段作為本體中類的屬性;
基于生成的屬性決策樹,使用OWL本體語言構建源數據本體類,讀取決策樹中各選擇枝作為屬性,構建最終決策類。
2.根據權利要求1所述的方法,其特征在于,所述預設算法為ID3算法。
3.根據權利要求1或2所述的方法,其特征在于,所述利用預設算法對所述源數據屬性表進行訓練,生成屬性決策樹,具體包括:
對待分類的屬性表的信息熵和屬性表中的每個字段的信息熵進行計算,得到屬性表信息熵和字段信息熵,并基于得到的屬性表信息熵和字段信息熵計算信息熵增益;
將計算的信息熵增益中的最大信息熵增益對應的字段確定為待分類屬性,并將分類屬性相同的集合進行合,作為相同子樣本集合;其中,將離散數據組合為點的集合,將連續數據組合為數據區間;
在子樣本集合中,如果某一類別屬性的單相取值表現優秀,則為該類別屬性新建分支并作為葉子節點,并且計算該類別屬性的屬性所占百分比以及記錄相應的判斷結果,并且返回調用節點;否則,重新調用算法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京信息科技大學,未經北京信息科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910588441.0/1.html,轉載請聲明來源鉆瓜專利網。





