[發(fā)明專利]基于百科數(shù)據(jù)的軍事知識圖譜構(gòu)建和問答方法在審
| 申請?zhí)枺?/td> | 202011489243.8 | 申請日: | 2020-12-16 |
| 公開(公告)號: | CN112667821A | 公開(公告)日: | 2021-04-16 |
| 發(fā)明(設(shè)計)人: | 路曉波;張可新;游若平 | 申請(專利權(quán))人: | 北京華如慧云數(shù)據(jù)科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35;G06F16/332;G06F16/28;G06F16/951;G06F16/953;G06F40/247;G06F40/295 |
| 代理公司: | 北京豐浩知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11781 | 代理人: | 李學(xué)康 |
| 地址: | 100094 北京市海淀區(qū)永豐*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 百科 數(shù)據(jù) 軍事 知識 圖譜 構(gòu)建 問答 方法 | ||
1.基于百科數(shù)據(jù)的軍事知識圖譜構(gòu)建和問答方法,其特征在于,包括如下步驟:
步驟1:爬取百科的分類數(shù)據(jù),將上述的分類數(shù)據(jù)視作概念數(shù)據(jù),將爬取后的分類數(shù)據(jù)添加到圖數(shù)據(jù)庫中,同時建立概念之間的從屬關(guān)系;
步驟2:迭代批量讀取、處理百科數(shù)據(jù),所述的百科數(shù)據(jù)是百科詞條的集合,提取出百科詞條中的同一實體名稱的多種表述,所述的同一實體名稱的多種表述稱之為同義詞,將這些同義詞添加到圖數(shù)據(jù)庫中,同時建立實體名稱和它的同義詞之間的關(guān)系;
步驟3:使用ElasticSearch創(chuàng)建擴展實體的搜索庫,在ElasticSearch中,創(chuàng)建索引,配置中文分詞引擎,將所有的百科數(shù)據(jù)導(dǎo)入ElasticSearch中,創(chuàng)建擴展實體的搜索庫;
步驟4:解析處理百科數(shù)據(jù),提取實體信息,添加更新同義詞數(shù)據(jù),采用規(guī)則和文本分類的方法過濾軍事實體,添加更新軍事類實體信息到圖數(shù)據(jù)庫中,建立實體與概念之間的關(guān)系,處理軍事實體信息關(guān)聯(lián)的擴展實體信息,搜索獲取擴展實體信息,判斷類別,添加擴展信息到圖數(shù)據(jù)庫,建立實體與拓展實體之間的關(guān)系;
步驟5:獲取輸入的實體查詢或問句,解析查詢語句,查詢問句的同義詞,通過實體識別獲取問句的實體提及,擴展實體提及,解析出關(guān)系相關(guān)的關(guān)鍵詞,匹配查詢圖數(shù)據(jù)庫,計算問句與實體屬性或關(guān)系詞的相關(guān)度,返回排序最高并高于閾值的實體或?qū)傩孕畔ⅰ?/p>
2.如權(quán)利要求1所述的基于百科數(shù)據(jù)的軍事知識圖譜構(gòu)建和問答方法,其特征在于:所述的步驟1中所述的概念之間的從屬關(guān)系包括下級概念與上級概念定義為SubClassOf,下級概念與上級概念有多對一和多對多的關(guān)系;所述的圖數(shù)據(jù)庫是NoSQL數(shù)據(jù)庫的一種類型,它應(yīng)用圖形理論存儲實體之間的關(guān)系信息。
3.如權(quán)利要求1所述的基于百科數(shù)據(jù)的軍事知識圖譜構(gòu)建和問答方法,其特征在于:所述的步驟2中百科數(shù)據(jù)的名稱具有多種表述方式,對于百科數(shù)據(jù)解析處理出的多種表述方式,稱之為同義詞,將同義詞的關(guān)系定義為synonym。
4.如權(quán)利要求1所述的基于百科數(shù)據(jù)的軍事知識圖譜構(gòu)建和問答方法,其特征在于:所述的步驟3中在ElasticSearch中創(chuàng)建的索引,包括以下三種方式:
方式一:將百科詞條標題、統(tǒng)一名稱、同義詞、簡介和信息框中的名稱信息解析成不同的字段,添加到ElasticSearch中;
方式二:將百科詞條標題、統(tǒng)一名稱、同義詞、簡介和信息框中的名稱信息解析成5個字段,添加到ElasticSearch中;
方式三:將百科詞條標題、統(tǒng)一名稱、同義詞和信息框中的名稱信息解析成一個字段,添加到ElasticSearch中。
5.如權(quán)利要求4所述的基于百科數(shù)據(jù)的軍事知識圖譜構(gòu)建和問答方法,其特征在于:所述的百科詞條中的中文的默認分詞方法采用ik_max_word方法,ik_max_word將文本做最細粒度的拆分。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京華如慧云數(shù)據(jù)科技有限公司,未經(jīng)北京華如慧云數(shù)據(jù)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011489243.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 網(wǎng)絡(luò)百科數(shù)據(jù)獲取方法及系統(tǒng)
- 網(wǎng)絡(luò)百科內(nèi)容形成方法、網(wǎng)絡(luò)服務(wù)器和客戶端
- 一種信息處理方法及終端
- 面向語義網(wǎng)的中文百科知識組織與集成方法
- 基于百科詞條構(gòu)建問答知識庫數(shù)據(jù)項的方法和裝置
- 一種百科內(nèi)容輸入方法及系統(tǒng)
- 一種信息展示的方法、裝置以及計算機存儲介質(zhì)
- 融合維基知識的變分半監(jiān)督百度百科分類方法
- 百科詞條的展示方法、裝置、設(shè)備、介質(zhì)及程序產(chǎn)品
- 一種信息處理的方法、裝置以及計算機存儲介質(zhì)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 一種特種燃料發(fā)動機引動力的多功能軍事坦克
- 一種基于大空間虛擬現(xiàn)實的多兵軍事訓(xùn)練考核系統(tǒng)
- 一種基于通用內(nèi)核本體的軍事領(lǐng)域本體構(gòu)建方法
- 一種軍事人員數(shù)據(jù)管理系統(tǒng)和方法
- 一種結(jié)合詞典的軍事想定文書實體信息抽取方法及裝置
- 一種用于軍事態(tài)勢建模的軍事對象表達裝置
- 一種基于多源數(shù)據(jù)融合模型的軍事訓(xùn)練水平綜合評估方法
- 一種軍事案例數(shù)據(jù)管理方法
- 一種軍事知識圖譜構(gòu)建方法及系統(tǒng)
- 多源軍事裝備知識關(guān)聯(lián)組織方法





