[發明專利]基于本體構建材料科學領域語義數據模型的方法有效
| 申請號: | 201210151430.4 | 申請日: | 2012-05-15 |
| 公開(公告)號: | CN102682122A | 公開(公告)日: | 2012-09-19 |
| 發明(設計)人: | 胡長軍;李揚;劉振宇;成欣 | 申請(專利權)人: | 北京科技大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京中博世達專利商標代理有限公司 11274 | 代理人: | 申健 |
| 地址: | 100083 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 本體 構建 材料科學 領域 語義 數據模型 方法 | ||
技術領域
本發明涉及一種構建語義數據模型的方法,尤其涉及一種基于本體構建材料科學領域語義數據模型(Semantic?Model?for?Materials?science?data,簡稱SMM)的方法,以實現為用戶提供科學領域數據服務。
背景技術
本體(Ontology)的概念起源于哲學領域,定義為“對世界上客觀存在物的系統描述”,但在計算機與信息科學領域,本體是指一種“形式化的,對于共享概念體系的明確而又詳細的說明”。本體提供一個共享詞匯表,描述特定領域之中那些對象類型、概念及其屬性和它們之間的相互關系。本體實際上就是對特定領域之中某些概念及其相互之間關系的形式化表達(formal?representation)。
本體是一種特殊類型的術語集,具有結構化的特點,非常適合于在計算機系統之中使用。本體的目標是獲取相關的領域知識,確定目標領域內共同認可的詞匯(術語),并從不同層次上明確的給出這些領域詞匯之間相互關系的形式化定義。使用本體可以為特定領域提供形式化的描述,包括形式化的知識表示、明確的領域詞匯和語義。本體形式化的好處就是可以提供機器可處理的語義描述,增加了人機之間和機器之間的可交流性,進而支持本體推理發現隱性領域知識,為用戶提供增值的信息服務。
近年國內外,在科學數據共享、智能化信息檢索、數字圖書館、知識工程和人工智能、信息系統集成、計算機輔助設計等諸多領域都得到了廣泛應用,也掀起了本體應用的研究熱潮。基于本體的數據語義集成方面的研究已取得大量的成果,利用本體技術解決數據源之間的語義異構問題也已成為異構集成普遍采用的方法。
但是,目前針對材料科學領域數據的本體語義集成尚有待研究擴展,因為基于本體的材料領域數據語義集成需要解決以下多個方面的問題:(1)具有大量的數據密集型應用,需要海量材料科學數據的支持;(2)材料科學數據異構、分布、結構雜亂、關聯復雜;(3)材料數據源間的語義互操作復雜,異構數據模式結構復雜多變,存取效率有待提升;(4)科學家需要從多個自治系統中獲得所需的材料科學數據,并人工將其所需服務提煉出來,耗時費力。
發明內容
本發明目的在于提供一種基于本體構建材料科學領域語義數據模型的方法,用于解決目前尚無針對材料科學領域數據的本體語義集成建模方法的問題。
為解決上述技術問題,本發明提供的基于本體構建材料科學領域語義數據模型的方法包括以下步驟:設計一種基于本體的材料科學領域語義數據模型,建立數據模式與本體之間的映射規則;基于所述語義數據模型,針對結構化數據、半結構化數據及非結構化數據進行基于本體的數據語義分析與標注,并構建領域數據的語義可視化模型,支持材料科學領域海量異構數據的語義集成與高效檢索;基于OWL-S(Ontology?Web?Language?for?Services,web服務的本體語言)技術對相關數據服務進行描述、發布與獲取,支持更高層次的材料科學領域服務語義協同。
本發明提供的首先基于數據建模定義將各類結構化、半結構化、非結構化數據進行語義包裝,根據映射規則庫構建語義模型,從而形成領域數據本體,構建材料科學領域知識庫;而后基于查詢構造器、查詢處理器及推理引擎構建材料科學領域數據語義查詢工具,形成基于本體的查詢接口,支持可視化語義檢索,為上層應用需求提供高效的數據語義查詢、互操作等相關服務,并基于OWL-S與本體技術進行服務語義的描述、發布、獲取,構建更為智能化的服務語義協同,提供更為深層、個性、靈活的材料領域知識服務。
其中,語義數據模型構建部分需滿足并實現五方面的目標:(1)保術語的一致性,該語義模型可以在該領域內重用;(2)該語義模型必須是形式化的,可以被計算機理解和操縱的;(3)該語義模型能夠在一定程度上支持語義推理,可以獲取隱含的知識信息;(4)充分表示材料數據之間存在的關聯關系;(5)在一定程度上表達數據的來源信息。
據此,可采用適當的語義模型構建方法來構建材料科學領域語義數據模型SMM,并通過增加適當的語義映射規則,構筑領域本體知識庫,完成數據語義建模,為海量異構數據的語義集成、高效查詢、服務組合等提供支持。
在本發明一個優選實施方式中,材料數據的語義集成部分主要包括如下四個方面的內容:結構化材料數據(關系數據庫)的語義集成;半結構化材料數據(MatML)的語義集成;非結構化材料數據(Image等)的語義標注;面向多語境環境下的數據檢索及語義可視化。
進一步地,結構化數據(關系數據庫)的語義集成部分,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京科技大學,未經北京科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210151430.4/2.html,轉載請聲明來源鉆瓜專利網。





