[發(fā)明專利]一種基于組合結(jié)構(gòu)的規(guī)范知識存儲方法在審
| 申請?zhí)枺?/td> | 202010565742.4 | 申請日: | 2020-06-19 |
| 公開(公告)號: | CN111915010A | 公開(公告)日: | 2020-11-10 |
| 發(fā)明(設(shè)計)人: | 黑新宏;楊明松;李宇超;趙欽;賈博;王媞霖;朱磊 | 申請(專利權(quán))人: | 西安理工大學(xué) |
| 主分類號: | G06N5/02 | 分類號: | G06N5/02;G06F16/901;G06F16/28;G06F16/25;G06F16/22;G06F16/31 |
| 代理公司: | 西安弘理專利事務(wù)所 61214 | 代理人: | 王丹 |
| 地址: | 710048 陜*** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 組合 結(jié)構(gòu) 規(guī)范 知識 存儲 方法 | ||
本發(fā)明公開了一種基于組合結(jié)構(gòu)的規(guī)范知識存儲方法,包括構(gòu)建規(guī)范基本信息抽取表、規(guī)范文本信息抽取表和規(guī)范語義信息抽取表,從規(guī)范非具體條文部分的版面中識別并抽取規(guī)范知識,完成規(guī)范基本信息抽取表的填寫;從規(guī)范正文中識別并抽取規(guī)范文本信息抽取表中所需的信息,完成規(guī)范文本信息抽取表的填寫;從規(guī)范文本中得到符號化的可計算語義信息,分析并抽取規(guī)范語義信息抽取表所需信息,完成規(guī)范語義信息抽取表的填寫;使用圖數(shù)據(jù)庫和關(guān)系數(shù)據(jù)庫對規(guī)范基本信息抽取表、規(guī)范文本信息抽取表和規(guī)范語義信息抽取表中信息進行存儲。采用本發(fā)明規(guī)范知識存儲方法能夠用于構(gòu)建大規(guī)模規(guī)范領(lǐng)域知識庫,覆蓋面廣。
技術(shù)領(lǐng)域
本發(fā)明屬于知識工程中的知識智能存儲技術(shù)領(lǐng)域,涉及一種基于組合結(jié)構(gòu)的規(guī)范知識存儲方法。
背景技術(shù)
人工智能為新時代的高質(zhì)量發(fā)展賦能,各傳統(tǒng)行業(yè)都在數(shù)據(jù)化、信息化、自動化、智能化的賽道上加速發(fā)展。建設(shè)提速增量的同時,也應(yīng)確保精準化設(shè)計、精益化施工、智能化管控。
行業(yè)規(guī)范作為設(shè)計、施工以及運維管控時的執(zhí)行依據(jù)和知識抽象,針對各個階段的操作過程以及產(chǎn)出成果提出了具體的約束要求和解釋說明。構(gòu)建規(guī)范領(lǐng)域知識庫是促進建筑行業(yè)智能化發(fā)展的基礎(chǔ)工作。同時領(lǐng)域知識的集成和管理也是人工智能在解決感知問題后向認知智能轉(zhuǎn)變時面臨的一大挑戰(zhàn),構(gòu)建領(lǐng)域大規(guī)模知識庫并基于知識進行推理和應(yīng)用是現(xiàn)階段領(lǐng)域人工智能的研究重點之一。
規(guī)范知識庫的構(gòu)建分為規(guī)范知識表示和規(guī)范知識存儲兩個大的部分。規(guī)范表示的方法多種多樣,但是存儲方法卻大同小異。現(xiàn)有的規(guī)范知識存儲方法分為三類:1)通過對規(guī)范知識硬編碼,采用內(nèi)置規(guī)則集的形式,實現(xiàn)存儲。該方法將知識表示與知識存儲綁定在一起,導(dǎo)致了規(guī)范知識的使用靈活度差、且難以更新維護等缺點;2)基于語義標記文件的形式進行存儲,如 XML文件、RDF文件或HTML文件等?;跇擞浳募拇鎯Ψ椒ù蠖嗍轻槍ι倭康臄?shù)據(jù)(如:某本規(guī)范中具體的某一章節(jié)),該方法用于海量的規(guī)范知識時需要借助關(guān)系數(shù)據(jù)庫等數(shù)據(jù)管理系統(tǒng)進行優(yōu)化。3)使用關(guān)系數(shù)據(jù)庫進行存儲。考慮到規(guī)范知識結(jié)構(gòu)的高相關(guān)性和高復(fù)雜性,在關(guān)系結(jié)構(gòu)存儲模型中需要建立大量的數(shù)據(jù)表來進行知識存儲,除了數(shù)據(jù)表設(shè)計難度高之外,大部分的表結(jié)構(gòu)層級復(fù)雜且數(shù)據(jù)稀疏。該方法在進行基于知識的查詢時,涉及多表聯(lián)查,需要使用大量join操作,并且SQL優(yōu)化難度高,查詢效率低下。除上述問題之外,現(xiàn)有的規(guī)范知識存儲模型僅關(guān)注蘊含在具體條文中的知識,忽略了蘊含在規(guī)范體系分類模式中和非具體條文部分的版面中所包含的領(lǐng)域知識,存在知識缺失問題。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于組合結(jié)構(gòu)的規(guī)范知識存儲方法,解決了現(xiàn)有規(guī)范知識存儲方法覆蓋面不全,對大批量關(guān)聯(lián)數(shù)據(jù)存儲難度大的問題。
本發(fā)明所采用的技術(shù)方案是,一種基于組合結(jié)構(gòu)的規(guī)范知識存儲方法,包括建立規(guī)范基本信息抽取表、規(guī)范文本信息抽取表和規(guī)范語義信息抽取表,從規(guī)范非具體條文部分的版面中識別并抽取規(guī)范知識,完成規(guī)范基本信息抽取表的填寫;從規(guī)范正文中識別并抽取規(guī)范文本信息抽取表中所需的信息,完成規(guī)范文本信息抽取表的填寫;從規(guī)范文本中得到符號化的可計算語義信息,分析并抽取規(guī)范語義信息抽取表所需信息,完成規(guī)范語義信息抽取表的填寫;使用圖數(shù)據(jù)庫和關(guān)系數(shù)據(jù)庫對規(guī)范基本信息抽取表、規(guī)范文本信息抽取表和規(guī)范語義信息抽取表中信息進行存儲。
本發(fā)明的技術(shù)特征還在于,
具體包括以下步驟:
步驟1,建立規(guī)范基本信息抽取表;
步驟2,從規(guī)范非具體條文部分的版面中識別并抽取所包含的規(guī)范知識,使用步驟1中建立的規(guī)范基本信息抽取表進行記錄;
步驟3,建立規(guī)范文本信息抽取表;
步驟4,從規(guī)范正文中識別并抽取規(guī)范文本信息抽取表中所需的信息,完成規(guī)范文本信息抽取表的填寫;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安理工大學(xué),未經(jīng)西安理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010565742.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種凱夫拉磨砂手套生產(chǎn)工藝
- 下一篇:立式高真空熱處理爐
- 卡片結(jié)構(gòu)、插座結(jié)構(gòu)及其組合結(jié)構(gòu)
- 鋼結(jié)構(gòu)平臺結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 單元結(jié)構(gòu)、結(jié)構(gòu)部件和夾層結(jié)構(gòu)
- 鋼結(jié)構(gòu)扶梯結(jié)構(gòu)
- 鋼結(jié)構(gòu)隔墻結(jié)構(gòu)
- 鋼結(jié)構(gòu)連接結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)





