[發(fā)明專利]一種基于云計(jì)算的知識圖譜架構(gòu)實(shí)現(xiàn)方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201911413712.5 | 申請日: | 2019-12-31 |
| 公開(公告)號: | CN111259086A | 公開(公告)日: | 2020-06-09 |
| 發(fā)明(設(shè)計(jì))人: | 張福強(qiáng) | 申請(專利權(quán))人: | 的盧技術(shù)有限公司 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28;G06F16/36;G06F16/951 |
| 代理公司: | 南京禹為知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 32272 | 代理人: | 王曉東 |
| 地址: | 211103 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 計(jì)算 知識 圖譜 架構(gòu) 實(shí)現(xiàn) 方法 系統(tǒng) | ||
1.一種基于云計(jì)算的知識圖譜架構(gòu)實(shí)現(xiàn)方法,其特征在于:包括以下步驟,
數(shù)據(jù)獲取模塊(100)獲取數(shù)據(jù)資源并存儲;
實(shí)體抽取模塊(200)從數(shù)據(jù)資源中進(jìn)行實(shí)體抽取,得到實(shí)體信息;
將實(shí)體信息傳輸至知識存儲模塊(400),并進(jìn)行存儲;
實(shí)體關(guān)聯(lián)模塊(300)從數(shù)據(jù)資源中進(jìn)行實(shí)體關(guān)系抽取;
將建立的實(shí)體關(guān)系傳輸至知識存儲模塊(400),并進(jìn)行存儲;
圖譜展示模塊(500)根據(jù)知識存儲模塊(400)存儲內(nèi)容進(jìn)行數(shù)據(jù)展示。
2.如權(quán)利要求1所述的基于云計(jì)算的知識圖譜架構(gòu)實(shí)現(xiàn)方法,其特征在于:所述數(shù)據(jù)獲取模塊(100)通過解析網(wǎng)頁來獲取數(shù)據(jù)資源。
3.如權(quán)利要求2所述的基于云計(jì)算的知識圖譜架構(gòu)實(shí)現(xiàn)方法,其特征在于:所述解析網(wǎng)頁還包括以下步驟,
通過http請求獲取網(wǎng)頁,并將獲取到的網(wǎng)頁進(jìn)行解析,從而得到網(wǎng)頁中所有的鏈接地址;
將得到的所有的url放入消息隊(duì)列中;
讀取存放url的消息隊(duì)列從而獲取url,根據(jù)url請求網(wǎng)頁內(nèi)容,獲取到網(wǎng)頁的內(nèi)容數(shù)據(jù),將得到的數(shù)據(jù)信息存儲在數(shù)據(jù)庫中;
從消息隊(duì)列中依次取網(wǎng)頁的url鏈接地址,并重復(fù)以上步驟。
4.如權(quán)利要求2或3所述的基于云計(jì)算的知識圖譜架構(gòu)實(shí)現(xiàn)方法,其特征在于:所述實(shí)體抽取模塊(200)進(jìn)行實(shí)體抽取還包括以下步驟,
將接收到的數(shù)據(jù)資源進(jìn)行轉(zhuǎn)化為Html Document格式;
從Document對象中提取對應(yīng)的實(shí)體信息。
5.如權(quán)利要求4所述的基于云計(jì)算的知識圖譜架構(gòu)實(shí)現(xiàn)方法,其特征在于:所述實(shí)體信息包括實(shí)體名稱以及屬性信息,屬性信息包括實(shí)體基本屬性、實(shí)體標(biāo)簽和實(shí)體描述信息。
6.如權(quán)利要求5所述的基于云計(jì)算的知識圖譜架構(gòu)實(shí)現(xiàn)方法,其特征在于:所述實(shí)體關(guān)聯(lián)模塊(300)的實(shí)體關(guān)系抽取還包括以下步驟,
讀取從數(shù)據(jù)獲取模塊(100)接收的數(shù)據(jù)資源;
解析數(shù)據(jù)資源,得到該數(shù)據(jù)資源與其他實(shí)體的關(guān)系;
根據(jù)該數(shù)據(jù)資源與其他實(shí)體的關(guān)系,結(jié)合實(shí)體抽取模塊(200)中的抽取的實(shí)體進(jìn)行關(guān)系關(guān)聯(lián),建立實(shí)體關(guān)系。
7.如權(quán)利要求5或6所述的基于云計(jì)算的知識圖譜架構(gòu)實(shí)現(xiàn)方法,其特征在于:所述知識存儲模塊(400)基于圖數(shù)據(jù)庫Neo4j實(shí)現(xiàn),進(jìn)行數(shù)據(jù)的存儲。
8.如權(quán)利要求7所述的基于云計(jì)算的知識圖譜架構(gòu)實(shí)現(xiàn)方法,其特征在于:所述知識存儲模塊(400)的實(shí)現(xiàn)還包括以下步驟,
根據(jù)實(shí)體關(guān)聯(lián)模塊(300)的建立的實(shí)體關(guān)系,構(gòu)建實(shí)體關(guān)系語句;
執(zhí)行實(shí)體關(guān)系語句,構(gòu)建實(shí)體之間的關(guān)聯(lián)。
9.一種基于云計(jì)算的知識圖譜架構(gòu)實(shí)現(xiàn)系統(tǒng),其特征在于:包括,
數(shù)據(jù)獲取模塊(100),所述數(shù)據(jù)獲取模塊(100)為一套爬蟲系統(tǒng),能夠從網(wǎng)絡(luò)上爬取數(shù)據(jù)資源并存儲;
實(shí)體抽取模塊(200),所述實(shí)體抽取模塊(200)能夠從數(shù)據(jù)資源中進(jìn)行進(jìn)行實(shí)體的抽取;
實(shí)體關(guān)聯(lián)模塊(300),所述實(shí)體關(guān)聯(lián)模塊(300)能夠從數(shù)據(jù)資源中進(jìn)行實(shí)體關(guān)系的抽取;
知識存儲模塊(400),所述知識存儲模塊(400)用于存儲抽取出來的實(shí)體數(shù)據(jù)和實(shí)體關(guān)系;
圖譜展示模塊(500),所述圖譜展示模塊(500)能夠根據(jù)知識存儲模塊(400)存儲內(nèi)容進(jìn)行數(shù)據(jù)展示。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于的盧技術(shù)有限公司,未經(jīng)的盧技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911413712.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識圖譜的構(gòu)建方法、裝置、知識圖譜系統(tǒng)及設(shè)備
- 一種基于知識圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種用于創(chuàng)建知識圖譜的計(jì)算機(jī)設(shè)備
- 一種支持增量實(shí)體關(guān)聯(lián)的關(guān)系圖譜計(jì)算方法





