[發明專利]基于本體構建材料科學領域語義數據模型的方法有效
| 申請號: | 201210151430.4 | 申請日: | 2012-05-15 |
| 公開(公告)號: | CN102682122A | 公開(公告)日: | 2012-09-19 |
| 發明(設計)人: | 胡長軍;李揚;劉振宇;成欣 | 申請(專利權)人: | 北京科技大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京中博世達專利商標代理有限公司 11274 | 代理人: | 申健 |
| 地址: | 100083 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 本體 構建 材料科學 領域 語義 數據模型 方法 | ||
1.一種基于本體構建材料科學領域語義數據模型的方法,其特征在于,包括以下步驟:
設計一種基于本體的材料科學領域語義數據模型,建立數據模式與本體之間的映射規則;
基于所述語義數據模型,針對結構化數據、半結構化數據及非結構化數據進行基于本體的數據語義分析與標注,并構建領域數據的語義可視化模型,支持材料科學領域海量異構數據的語義集成與高效檢索;
基于OWL-S技術對相關數據服務進行描述、發布與獲取,支持更高層次的材料科學領域服務語義協同。
2.根據權利要求1所述的方法,其特征在于,所述材料科學領域海量異構數據的語義集成步驟包括:結構化材料數據的語義集成、半結構化材料數據的語義集成、非結構化材料數據的語義標注和面向多語境環境下的數據檢索及語義可視化。
3.根據權利要求2所述的方法,其特征在于,所述結構化數據的語義集成步驟包括:
采用基于語義的多規則映射技術,將結構化數據統一映射為規范化XML文檔;
針對多源異構數據進行錯誤數據刪減、缺失數據賦值、數據精度調整、單位制轉換、關聯數據完善操作;
通過字符集轉換、類型轉換、單記錄拆分、多記錄合并、關聯推導法,建立材料數據語義映射模型,支持結構化數據的關聯合并。
4.根據權利要求2所述的方法,其特征在于,所述半結構化數據的語義集成步驟包括:
定義一系列規則,從MatML?Schema抽取出一個MatOWL本體,其中MatML為半結構化數據;
將MatML文檔轉換為OWL實例;
利用邏輯規則建立MatOWL本體與材料服務模型的映射關系,基于MapReduce虛擬存儲分析處理機制,建立統一邏輯視圖與物理存儲之間的映射;
利用SPARQL語義查詢語言對MatML數據進行查詢,并從算法上優化查詢效率,實現數據的高效檢索。
5.根據權利要求2所述的方法,其特征在于,所述非結構化數據的語義標注步驟包括:
知識獲取:收集針對非結構化數據的描述詞匯,對詞匯進行篩選、分析,并建立共享領域詞匯表對收集的詞匯進行統一存儲管理,形成一個領域知識架構雛形,認知并獲取相應知識概念;
領域本體建模:將收集的領域詞匯轉換成本體中對應的元素,并定義元素的類和屬性的關系以及限制約束條件,然后以本體描述語言進行表示,以將領域中的知識轉換成機器可理解的形式,并使用推理機對定義的概念邏輯關系進行一致性檢驗,用于指導本體的修正;
知識表達:針對實際的非結構化數據,根據建立的本體對數據的內容進行標注。
6.根據權利要求5所述的方法,其特征在于,所述知識表達步驟包
數據分類:根據非結構化數據的內容進行分類,以便于有效的區分出數據內容的初步語義不同,使之能與所構建的本體表達的語義一致;
內容提取:從媒體信息、對象、事件三個層次提取出非結構化數據內容的實體;
邏輯關系:通過描述非結構化數據中的實體的語義關系來完成所有屬性實例的添加,其關系與本體中已定義的描述邏輯是一致的;
標注描述:重復數據分類、內容提取和邏輯關系步驟,完成對所有非結構化數據的標注描述,并基于此開發可視化的標注工具,提供領域共享詞匯表和本體框架幫助使用者更精確的依據本體內容進行非結構化數據的標注,并以OWL本體描述語言來對標注內容進行描述和存儲。
7.根據權利要求2所述的方法,其特征在于,所述面向多語境環境下的數據檢索及語義可視化步驟包括:
利用語義Web技術建立多級、主動、開放的材料科學數據本體映射機制,實現數據隱含知識的語義映射;
采用面向多源異構、多粒度、多維度材料領域數據的聚類、分類、關聯分析,建立多語境環境下數據語義內在特性、關聯的實時挖掘模型,形成并構建推理引擎,支持數據語義的交互協同與關聯演化;
利用信息可視化,建立多語境交互環境中的數據語義可視化模型,實現基于語義的多應用領域服務融合與決策支持。
8.根據權利要求1所述的方法,其特征在于,所述服務語義協同步驟包括:
服務語義描述:采用基于語義的服務表示方法,利用OWL-S和本從材料領域數據的混雜服務中抽象出通用服務屬性,構建基于本體的服描述來標識各類服務;
服務語義注冊及發布:通過對服務訪問相關屬性的語義描述,確立面向領域數據融合、處理的分層統一服務語義模型,建立基于語義的服務UDDI中心對服務進行公共注冊,進而將服務及其模型的語義描述發布到上層應用;
服務語義獲取:建立基于服務模型的語義理解與分析機制,通過材料科學數據語義信息與決策需求的逆向解析與任務分解,建立基于語義推理規則的服務獲取機制,從而獲取數據處理服務的關聯信息;
服務語義協同及組合:通過統一定義的服務互操作訪問接口,利用工作流協調機制構建服務編排模型,深層挖掘其服務語義關系鏈的協作機制,有效發現各類服務及協同組合規律,實現面向高效服務規劃組合的材料科學領域服務融合與協作共享。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京科技大學,未經北京科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210151430.4/1.html,轉載請聲明來源鉆瓜專利網。





