[發明專利]一種基于決策樹的數據庫本體學習優化方法在審
| 申請號: | 201910588441.0 | 申請日: | 2019-07-01 |
| 公開(公告)號: | CN110377754A | 公開(公告)日: | 2019-10-25 |
| 發明(設計)人: | 劉秀磊;丁嘉偉;劉旭紅;張良;曹建制 | 申請(專利權)人: | 北京信息科技大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35;G06F16/28;G06K9/62 |
| 代理公司: | 北京青松知識產權代理事務所(特殊普通合伙) 11384 | 代理人: | 鄭青松 |
| 地址: | 100089 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 決策樹 源數據 讀取 數據庫本體 語言構建 屬性表 數據庫 學習 決策樹算法 數據庫生成 人力成本 有效表示 預設算法 約束規則 最終決策 構建 填充 優化 存儲 分類 發現 | ||
本發明提供了一種基于決策樹的數據庫本體學習優化方法,包括以下步驟:確定待分類的源數據屬性表;利用預設算法對所述源數據屬性表進行訓練,生成屬性決策樹;基于生成的屬性決策樹,使用OWL本體語言構建源數據本體,讀取數據庫表字段作為本體中類的屬性;基于生成的屬性決策樹,使用OWL本體語言構建源數據本體類,讀取決策樹中各選擇枝作為屬性,構建最終決策類。本發明由決策樹算法處理后的數據可以用本體有效表示與存儲,與數據庫學習直接生成的本體對比,由數據庫生成的決策樹可以為本體添加更多的約束規則,發現的隱藏規則可以作為現有本體的填充。此外,使用本體學習技術可以讓機器代替手工節省大量人力成本。
技術領域
本發明涉及一種數據庫本體學習優化方法,具體涉及一種基于決策樹的數據庫本體學習優化方法。
背景技術
本體的目的是獲取相關領域的知識,提供對領域知識的共同理解,確定該領域中普遍接受的詞匯,并從不同的形式化模型中給出詞匯量與詞匯量之間的關系。本體的構建擴展和推理都基于開放世界知識,即不與客觀世界的邏輯違背,但同時又可以轉換為數學符號推理概念之間的語義關系,便于計算機理解。
然而,跨領域構建本體時,許多無法抗拒的困難讓其變得無比艱難。如:本體的形式描述是一種抽象的方法,而其具體表達方式又比較模糊,這就造成了難以定性事物特征的情況。這大大增加了將龐大信息實體概念化的難度。而本體構建的理論基礎是由描述邏輯確定的,它描述了事物間概念化的推理機制,并用數學的方式進行證明推理的可行性、正確性,這對本體構建的可擴展性提供了保障,但與此同時增加了本體構建的難度,非計算機領域專家在構建自身相關領域本體時難以確定描述邏輯的具體方法,難以做到用計算機理解的語言表述自身領域的語言,而計算機領域專家構建其他領域本體時無法確定領域相關知識,更無法進一步概念化本體,使得往往需要領域專家首先手工確定領域知識,確定領域概念,概念關系,再由計算機領域專家將知識描述為本體,費時費力,成本過高。
因此,亟待需要提供一種本體表達能力強且省時省力的本體構建方法。
發明內容
針對上述技術問題,本發明旨在提供一種基于決策樹的數據庫本體學習優化方法,該方法優化后的本體表達能力強,且省時省力。
本發明采用的技術方案為:
本發明實施例提供一種基于決策樹的數據庫本體學習優化方法,包括以下步驟:
確定待分類的源數據屬性表;
利用預設算法對所述源數據屬性表進行訓練,生成屬性決策樹;
基于生成的屬性決策樹,使用OWL本體語言構建源數據本體,讀取數據庫表字段作為本體中類的屬性;
基于生成的屬性決策樹,使用OWL本體語言構建源數據本體類,讀取決策樹中各選擇枝作為屬性,構建最終決策類。
可選地,所述預設算法為ID3算法。
可選地,所述利用預設算法對所述源數據屬性表進行訓練,生成屬性決策樹,具體包括:
對待分類的屬性表的信息熵和屬性表中的每個字段的信息熵進行計算,得到屬性表信息熵和字段信息熵,并基于得到的屬性表信息熵和字段信息熵計算信息熵增益;
將計算的信息熵增益中的最大信息熵增益對應的字段確定為待分類屬性,并將分類屬性相同的集合進行合,作為相同子樣本集合;其中,將離散數據組合為點的集合,將連續數據組合為數據區間;
在子樣本集合中,如果某一類別屬性的單相取值表現優秀,則為該類別屬性新建分支并作為葉子節點,并且計算該類別屬性的屬性所占百分比以及記錄相應的判斷結果,并且返回調用節點;否則,重新調用算法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京信息科技大學,未經北京信息科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910588441.0/2.html,轉載請聲明來源鉆瓜專利網。





