[發(fā)明專利]知識圖譜構(gòu)建方法和裝置、服務(wù)器、計(jì)算機(jī)可讀存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202010068813.X | 申請日: | 2020-01-21 |
| 公開(公告)號: | CN111291135A | 公開(公告)日: | 2020-06-16 |
| 發(fā)明(設(shè)計(jì))人: | 費(fèi)加磊;黃繼青 | 申請(專利權(quán))人: | 深圳追一科技有限公司 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28;G06F16/36;G06F40/30 |
| 代理公司: | 廣州華進(jìn)聯(lián)合專利商標(biāo)代理有限公司 44224 | 代理人: | 方高明 |
| 地址: | 518051 廣東省深圳市南山區(qū)粵海街道*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 知識 圖譜 構(gòu)建 方法 裝置 服務(wù)器 計(jì)算機(jī) 可讀 存儲 介質(zhì) | ||
本申請涉及一種知識圖譜構(gòu)建方法和裝置、服務(wù)器、計(jì)算機(jī)可讀存儲介質(zhì),包括:獲取預(yù)設(shè)領(lǐng)域的資源數(shù)據(jù),對預(yù)設(shè)領(lǐng)域的資源數(shù)據(jù)進(jìn)行預(yù)處理,得到預(yù)處理后的資源數(shù)據(jù)。對預(yù)處理后的資源數(shù)據(jù)進(jìn)行知識建模得到知識圖譜本體,知識圖譜本體包括實(shí)體節(jié)點(diǎn)、字面量節(jié)點(diǎn)、實(shí)體節(jié)點(diǎn)之間的關(guān)系、實(shí)體節(jié)點(diǎn)與字面量節(jié)點(diǎn)之間的關(guān)系。從預(yù)處理后的資源數(shù)據(jù)中抽取出符合知識圖譜本體的三元組數(shù)據(jù),三元組數(shù)據(jù)由實(shí)體節(jié)點(diǎn)、字面量節(jié)點(diǎn)、實(shí)體節(jié)點(diǎn)之間的關(guān)系、實(shí)體節(jié)點(diǎn)與字面量節(jié)點(diǎn)之間的關(guān)系所構(gòu)成的,根據(jù)三元組數(shù)據(jù)構(gòu)建知識圖譜。從資源數(shù)據(jù)中分別抽取出實(shí)體節(jié)點(diǎn)和字面量節(jié)點(diǎn),可以更好地對資源數(shù)據(jù)進(jìn)行分類,從而提高所構(gòu)建的知識圖譜的檢索效率。
技術(shù)領(lǐng)域
本申請涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別是涉及一種知識圖譜構(gòu)建方法和裝置、服務(wù)器、計(jì)算機(jī)可讀存儲介質(zhì)。
背景技術(shù)
知識圖譜是一種基于圖的數(shù)據(jù)結(jié)構(gòu),其本質(zhì)是語義網(wǎng)絡(luò)。與通用知識圖譜不同,行業(yè)知識圖譜是面向特定領(lǐng)域的知識圖譜。特定領(lǐng)域的資源數(shù)據(jù)專業(yè)性更強(qiáng),因此所構(gòu)建的行業(yè)知識圖譜需要具備更高的可用性和檢索效率。有效的建模方法直接決定了所搭建的知識圖譜的應(yīng)用能力,并能夠在很大程度上賦能知識圖譜的后續(xù)應(yīng)用能力。相對地,一個建模較差的知識圖譜在后期的使用中將會遇到諸多瓶頸。采用傳統(tǒng)建模方法所構(gòu)建的行業(yè)知識圖譜的檢索效率較低。因此,亟待解決傳統(tǒng)的行業(yè)知識圖譜檢索效率較低的問題。
發(fā)明內(nèi)容
本申請實(shí)施例提供一種知識圖譜構(gòu)建方法、裝置、服務(wù)器、計(jì)算機(jī)可讀存儲介質(zhì),可以提高所構(gòu)建的知識圖譜的檢索效率。
一種知識圖譜構(gòu)建方法,包括:
獲取預(yù)設(shè)領(lǐng)域的資源數(shù)據(jù);
對所述預(yù)設(shè)領(lǐng)域的資源數(shù)據(jù)進(jìn)行預(yù)處理,得到預(yù)處理后的資源數(shù)據(jù);
對所述預(yù)處理后的資源數(shù)據(jù)進(jìn)行知識建模得到知識圖譜本體,所述知識圖譜本體包括實(shí)體節(jié)點(diǎn)、字面量節(jié)點(diǎn)、所述實(shí)體節(jié)點(diǎn)之間的關(guān)系、所述實(shí)體節(jié)點(diǎn)與所述字面量節(jié)點(diǎn)之間的關(guān)系;
從所述預(yù)處理后的資源數(shù)據(jù)中抽取出符合所述知識圖譜本體的三元組數(shù)據(jù),所述三元組數(shù)據(jù)由所述實(shí)體節(jié)點(diǎn)、字面量節(jié)點(diǎn)、所述實(shí)體節(jié)點(diǎn)之間的關(guān)系、所述實(shí)體節(jié)點(diǎn)與所述字面量節(jié)點(diǎn)之間的關(guān)系所構(gòu)成的;
根據(jù)所述三元組數(shù)據(jù)構(gòu)建知識圖譜。
在其中一個實(shí)施例中,所述對所述預(yù)處理后的資源數(shù)據(jù)進(jìn)行知識建模得到知識圖譜本體,所述知識圖譜本體包括實(shí)體節(jié)點(diǎn)、字面量節(jié)點(diǎn)、所述實(shí)體節(jié)點(diǎn)之間的關(guān)系、所述實(shí)體節(jié)點(diǎn)與所述字面量節(jié)點(diǎn)之間的關(guān)系,包括:
從所述預(yù)處理后的資源數(shù)據(jù)提取出節(jié)點(diǎn);
從所述節(jié)點(diǎn)中獲取重要程度高于預(yù)設(shè)閾值的節(jié)點(diǎn)作為實(shí)體節(jié)點(diǎn),從所述節(jié)點(diǎn)中獲取重要程度小于或等于預(yù)設(shè)閾值的節(jié)點(diǎn)作為字面量節(jié)點(diǎn);
獲取所述實(shí)體節(jié)點(diǎn)之間的關(guān)系、所述實(shí)體節(jié)點(diǎn)與所述字面量節(jié)點(diǎn)之間的關(guān)系;
根據(jù)所述實(shí)體節(jié)點(diǎn)、所述字面量節(jié)點(diǎn)、所述實(shí)體節(jié)點(diǎn)之間的關(guān)系、所述實(shí)體節(jié)點(diǎn)與所述字面量節(jié)點(diǎn)之間的關(guān)系得到知識圖譜本體。
在其中一個實(shí)施例中,所述獲取所述實(shí)體節(jié)點(diǎn)之間的關(guān)系、所述實(shí)體節(jié)點(diǎn)與所述字面量節(jié)點(diǎn)之間的關(guān)系,包括:
基于所述預(yù)處理后的資源數(shù)據(jù)的上下文信息,抽取出所述實(shí)體節(jié)點(diǎn)之間的關(guān)系、所述實(shí)體節(jié)點(diǎn)與所述字面量節(jié)點(diǎn)之間的關(guān)系。
在其中一個實(shí)施例中,所述符合所述知識圖譜本體的三元組數(shù)據(jù)包括第一種三元組數(shù)據(jù)及第二種三元組數(shù)據(jù),所述第一種三元組數(shù)據(jù)包括第一實(shí)體節(jié)點(diǎn)、第二實(shí)體節(jié)點(diǎn)、所述第一實(shí)體節(jié)點(diǎn)與第二實(shí)體節(jié)點(diǎn)之間的關(guān)系,所述第二種三元組數(shù)據(jù)包括第三實(shí)體節(jié)點(diǎn)、第一字面量節(jié)點(diǎn)、所述第三實(shí)體節(jié)點(diǎn)與所述第一字面量節(jié)點(diǎn)之間的關(guān)系;
所述從所述預(yù)處理后的資源數(shù)據(jù)中抽取出符合所述知識圖譜本體的三元組數(shù)據(jù),包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳追一科技有限公司,未經(jīng)深圳追一科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010068813.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識圖譜的構(gòu)建方法、裝置、知識圖譜系統(tǒng)及設(shè)備
- 一種基于知識圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種用于創(chuàng)建知識圖譜的計(jì)算機(jī)設(shè)備
- 一種支持增量實(shí)體關(guān)聯(lián)的關(guān)系圖譜計(jì)算方法
- 構(gòu)建墊、實(shí)體圖像構(gòu)建物和構(gòu)建構(gòu)建物支撐件的方法
- 支持松耦合的軟件構(gòu)建方法、系統(tǒng)及該系統(tǒng)的實(shí)現(xiàn)方法
- 版本的構(gòu)建系統(tǒng)及方法
- 工程構(gòu)建系統(tǒng)及其構(gòu)建方法
- 實(shí)例構(gòu)建方法、裝置及軟件系統(tǒng)
- 軟件構(gòu)建方法、軟件構(gòu)建裝置和軟件構(gòu)建系統(tǒng)
- 天花板地圖構(gòu)建方法、構(gòu)建裝置以及構(gòu)建程序
- 一種項(xiàng)目構(gòu)建方法、持續(xù)集成系統(tǒng)及終端設(shè)備
- 并行構(gòu)建的方法、裝置及設(shè)備
- 構(gòu)建肺癌預(yù)測模型構(gòu)建方法





