[發(fā)明專利]一種基于云計算的知識圖譜架構(gòu)實現(xiàn)方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201911413712.5 | 申請日: | 2019-12-31 |
| 公開(公告)號: | CN111259086A | 公開(公告)日: | 2020-06-09 |
| 發(fā)明(設(shè)計)人: | 張福強 | 申請(專利權(quán))人: | 的盧技術(shù)有限公司 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28;G06F16/36;G06F16/951 |
| 代理公司: | 南京禹為知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 32272 | 代理人: | 王曉東 |
| 地址: | 211103 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 計算 知識 圖譜 架構(gòu) 實現(xiàn) 方法 系統(tǒng) | ||
本發(fā)明公開了一種基于云計算的知識圖譜架構(gòu)實現(xiàn)方法及系統(tǒng),其特征在于:包括以下步驟,一種基于云計算的知識圖譜架構(gòu)實現(xiàn)方法,包括以下步驟,數(shù)據(jù)獲取模塊獲取數(shù)據(jù)資源并存儲;實體抽取模塊從數(shù)據(jù)資源中進行實體抽取,得到實體信息;將實體信息傳輸至知識存儲模塊,并進行存儲;實體關(guān)聯(lián)模塊從數(shù)據(jù)資源中進行實體關(guān)系抽取;將建立的實體關(guān)系傳輸至知識存儲模塊,并進行存儲;圖譜展示模塊根據(jù)知識存儲模塊存儲內(nèi)容進行數(shù)據(jù)展示。本發(fā)明的有益效果:將資源獲取、實體抽取和實體關(guān)系存儲合理結(jié)合,從而構(gòu)建成一整套可用于AI人工智能中的知識圖譜,對外提供完整的數(shù)據(jù)服務(wù),并應(yīng)用于人工智能等領(lǐng)域中。
技術(shù)領(lǐng)域
本發(fā)明涉及云計算的技術(shù)領(lǐng)域,尤其涉及一種基于云計算的知識圖譜架構(gòu)實現(xiàn)方法及系統(tǒng)。
背景技術(shù)
近年來,隨著人工智能技術(shù)的發(fā)展,知識圖譜的重要性逐漸凸顯出來,尤其人工智能中自然語言識別與人機對話,更是離不開知識圖譜,知識圖譜能夠用來將自然界中存在的實體以及概念,通過關(guān)系的形式關(guān)聯(lián)起來。
而現(xiàn)有的計算機領(lǐng)域沒有一個系統(tǒng)的方法或者架構(gòu),將具體的知識圖譜的實現(xiàn)方法描述以及實現(xiàn),較多的存在于概念,也沒有系統(tǒng)的實現(xiàn)從數(shù)據(jù)挖掘到實體關(guān)聯(lián)、圖譜展示的整個過程。
發(fā)明內(nèi)容
本部分的目的在于概述本發(fā)明的實施例的一些方面以及簡要介紹一些較佳實施例。在本部分以及本申請的說明書摘要和發(fā)明名稱中可能會做些簡化或省略以避免使本部分、說明書摘要和發(fā)明名稱的目的模糊,而這種簡化或省略不能用于限制本發(fā)明的范圍。
鑒于上述現(xiàn)有存在的問題,提出了本發(fā)明。
因此,本發(fā)明解決的一個技術(shù)問題是:提供一種基于云計算的知識圖譜架構(gòu)實現(xiàn)方法,結(jié)合爬蟲服務(wù)、實體抽取關(guān)系抽取、圖譜數(shù)據(jù)存儲這三種不同的服務(wù),并對外提供完整的數(shù)據(jù)服務(wù)。
為解決上述技術(shù)問題,本發(fā)明提供如下技術(shù)方案:一種基于云計算的知識圖譜架構(gòu)實現(xiàn)方法,包括以下步驟,數(shù)據(jù)獲取模塊獲取數(shù)據(jù)資源并存儲;實體抽取模塊從數(shù)據(jù)資源中進行實體抽取,得到實體信息;將實體信息傳輸至知識存儲模塊,并進行存儲;實體關(guān)聯(lián)模塊從數(shù)據(jù)資源中進行實體關(guān)系抽取;將建立的實體關(guān)系傳輸至知識存儲模塊,并進行存儲;圖譜展示模塊根據(jù)知識存儲模塊存儲內(nèi)容進行數(shù)據(jù)展示。
作為本發(fā)明所述的基于云計算的知識圖譜架構(gòu)實現(xiàn)方法的一種優(yōu)選方案,其中:所述數(shù)據(jù)獲取模塊通過解析網(wǎng)頁來獲取數(shù)據(jù)資源。
作為本發(fā)明所述的基于云計算的知識圖譜架構(gòu)實現(xiàn)方法的一種優(yōu)選方案,其中:所述解析網(wǎng)頁還包括以下步驟,通過http請求獲取網(wǎng)頁,并將獲取到的網(wǎng)頁進行解析,從而得到網(wǎng)頁中所有的鏈接地址;將得到的所有的url放入消息隊列中;讀取存放url的消息隊列從而獲取url,根據(jù)url請求網(wǎng)頁內(nèi)容,獲取到網(wǎng)頁的內(nèi)容數(shù)據(jù),將得到的數(shù)據(jù)信息存儲在數(shù)據(jù)庫中;從消息隊列中依次取網(wǎng)頁的url鏈接地址,并重復以上步驟。
作為本發(fā)明所述的基于云計算的知識圖譜架構(gòu)實現(xiàn)方法的一種優(yōu)選方案,其中:所述實體抽取模塊進行實體抽取還包括以下步驟,將接收到的數(shù)據(jù)資源進行轉(zhuǎn)化為HtmlDocument格式;從Document對象中提取對應(yīng)的實體信息。
作為本發(fā)明所述的基于云計算的知識圖譜架構(gòu)實現(xiàn)方法的一種優(yōu)選方案,其中:所述實體信息包括實體名稱以及屬性信息,屬性信息包括實體基本屬性、實體標簽和實體描述信息。
作為本發(fā)明所述的基于云計算的知識圖譜架構(gòu)實現(xiàn)方法的一種優(yōu)選方案,其中:所述實體關(guān)聯(lián)模塊的實體關(guān)系抽取還包括以下步驟,讀取從數(shù)據(jù)獲取模塊接收的數(shù)據(jù)資源;解析數(shù)據(jù)資源,得到該數(shù)據(jù)資源與其他實體的關(guān)系;根據(jù)該數(shù)據(jù)資源與其他實體的關(guān)系,結(jié)合實體抽取模塊中的抽取的實體進行關(guān)系關(guān)聯(lián),建立實體關(guān)系。
作為本發(fā)明所述的基于云計算的知識圖譜架構(gòu)實現(xiàn)方法的一種優(yōu)選方案,其中:所述知識存儲模塊基于圖數(shù)據(jù)庫Neo4j實現(xiàn),進行數(shù)據(jù)的存儲。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于的盧技術(shù)有限公司,未經(jīng)的盧技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911413712.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識圖譜的構(gòu)建方法、裝置、知識圖譜系統(tǒng)及設(shè)備
- 一種基于知識圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種用于創(chuàng)建知識圖譜的計算機設(shè)備
- 一種支持增量實體關(guān)聯(lián)的關(guān)系圖譜計算方法





