[發(fā)明專利]基于動態(tài)本體的語義和知識圖譜分析方法、平臺及設(shè)備在審
| 申請?zhí)枺?/td> | 202010131440.6 | 申請日: | 2020-02-28 |
| 公開(公告)號: | CN113326381A | 公開(公告)日: | 2021-08-31 |
| 發(fā)明(設(shè)計)人: | 王洪波;余江;王亞強;張三海 | 申請(專利權(quán))人: | 拓爾思天行網(wǎng)安信息技術(shù)有限責(zé)任公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/33;G06F40/295;G06F40/30 |
| 代理公司: | 北京志霖恒遠(yuǎn)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11435 | 代理人: | 郭棟梁 |
| 地址: | 100084 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 動態(tài) 本體 語義 知識 圖譜 分析 方法 平臺 設(shè)備 | ||
本申請公開了一種基于動態(tài)本體的語義和知識圖譜分析方法、平臺及設(shè)備,該方法包括:獲取待處理數(shù)據(jù);對所述待處理數(shù)據(jù)進(jìn)行文本語義分析和本體化映射處理,抽取本體結(jié)構(gòu),所述本體結(jié)構(gòu)包括對象、屬性和關(guān)系;基于所述對象、屬性和關(guān)系之間的聯(lián)系,構(gòu)建知識圖譜庫,以使得所述對所述待處理數(shù)據(jù)進(jìn)行分析處理。該技術(shù)方案融合了動態(tài)本體知識建模、知識圖譜技術(shù)和大數(shù)據(jù)技術(shù)等多種技術(shù),實現(xiàn)了對多源異構(gòu)數(shù)據(jù)的整合加工,且能夠通過文本語義分析和本體化映射處理方法,自動抽取出本體結(jié)構(gòu),進(jìn)而構(gòu)建出知識圖譜庫,實現(xiàn)了對海量多源異構(gòu)數(shù)據(jù)的快速關(guān)聯(lián)挖掘,能夠?qū)Χ嘣串悩?gòu)數(shù)據(jù)進(jìn)行綜合分析,提高了數(shù)據(jù)的使用價值。
技術(shù)領(lǐng)域
本發(fā)明一般涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,具體涉及一種基于動態(tài)本體的語義和知識圖譜分析方法、平臺及設(shè)備。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,人工智能已經(jīng)成為各領(lǐng)域的競爭焦點,各行各業(yè)紛紛踏上智能化升級與轉(zhuǎn)型的道路,隨之增加了對智能化應(yīng)用的需求,為了滿足人工智能對海量多源異構(gòu)數(shù)據(jù)及數(shù)據(jù)關(guān)聯(lián)挖掘的需要,對大數(shù)據(jù)進(jìn)行綜合分析尤為重要。
目前,現(xiàn)有技術(shù)中對多源異構(gòu)數(shù)據(jù)進(jìn)行分析使用的工具比較傳統(tǒng),且對數(shù)據(jù)的數(shù)據(jù)格式要求較高,導(dǎo)致對中文處理支持性差,無法全面地對數(shù)據(jù)進(jìn)行綜合分析,大大降低了數(shù)據(jù)的使用價值。
發(fā)明內(nèi)容
鑒于現(xiàn)有技術(shù)中的上述缺陷或不足,期望提供一種基于動態(tài)本體的語義和知識圖譜分析方法、平臺、設(shè)備和介質(zhì),能夠通過文本語義分析和本體化映射處理,構(gòu)建出知識圖譜庫,從而能夠?qū)Χ嘣串悩?gòu)數(shù)據(jù)進(jìn)行綜合分析,很大程度上提高了數(shù)據(jù)的使用價值,快速實現(xiàn)了從數(shù)據(jù)到知識的轉(zhuǎn)化。
第一方面,本申請實施例提供了一種基于動態(tài)本體的語義和知識圖譜分析方法,該方法包括:
獲取待處理數(shù)據(jù);
對所述待處理數(shù)據(jù)進(jìn)行文本語義分析和本體化映射處理,抽取本體結(jié)構(gòu),所述本體結(jié)構(gòu)包括對象、屬性和關(guān)系;
基于所述對象、屬性和關(guān)系之間的聯(lián)系,構(gòu)建知識圖譜庫。
在其中一個實施例中,對所述待處理數(shù)據(jù)進(jìn)行文本語義分析處理和本體化映射處理,抽取本體結(jié)構(gòu),包括:
通過數(shù)據(jù)知識化處理工具定義本體結(jié)構(gòu)規(guī)則;
注冊數(shù)據(jù)庫表,所述數(shù)據(jù)庫表用于抽取知識;
基于所述數(shù)據(jù)庫表和所述文本結(jié)構(gòu)規(guī)則,得到本體結(jié)構(gòu)。
在其中一個實施例中,基于所述對象、屬性和關(guān)系之間的聯(lián)系,構(gòu)建知識圖譜庫,包括:
對所述待處理數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗處理,得到處理后的數(shù)據(jù);
根據(jù)所述本體結(jié)構(gòu)與知識的對應(yīng)關(guān)系,構(gòu)建核心領(lǐng)域本體庫;
基于所述核心領(lǐng)域本體庫和所述預(yù)處理后的數(shù)據(jù),得到知識圖譜庫。
在其中一個實施例中,對所述待處理數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗處理,得到處理后的數(shù)據(jù),包括:
根據(jù)數(shù)據(jù)清洗規(guī)則對所述待處理數(shù)據(jù)進(jìn)行檢測,確定所述待處理數(shù)據(jù)的類別,所述類別包括正常、已知異常和未知異常;
基于所述待處理數(shù)據(jù)的類別和所述數(shù)據(jù)清洗規(guī)則,得到處理后的數(shù)據(jù)。
在其中一個實施例中,,根據(jù)所述本體結(jié)構(gòu)與知識的對應(yīng)關(guān)系,構(gòu)建核心領(lǐng)域本體庫,包括:
對獲取的知識進(jìn)行知識整理,提取領(lǐng)域知識;
基于所述領(lǐng)域知識和所述本體結(jié)構(gòu)的映射規(guī)則,構(gòu)建核心領(lǐng)域本體庫。
在其中一個實施例中,在構(gòu)建知識圖譜庫之后,所述方法還包括:
使用知識圖譜平臺對所述知識圖譜庫進(jìn)行管理;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于拓爾思天行網(wǎng)安信息技術(shù)有限責(zé)任公司,未經(jīng)拓爾思天行網(wǎng)安信息技術(shù)有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010131440.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





