[發明專利]融合多類事理與實體知識的領域事件圖譜構建方法和裝置有效
| 申請號: | 201911059404.7 | 申請日: | 2019-11-01 |
| 公開(公告)號: | CN110968700B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 請求不公布姓名 | 申請(專利權)人: | 數地工場(南京)科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/247;G06N5/022 |
| 代理公司: | 北京君尚知識產權代理有限公司 11200 | 代理人: | 邱曉鋒 |
| 地址: | 211100 江蘇省南京市麒麟科技創*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 融合 事理 實體 知識 領域 事件 圖譜 構建 方法 裝置 | ||
1.一種融合多類事理與實體知識的領域事件圖譜構建方法,其特征在于,包括以下步驟:
對領域語料庫進行事理關系抽取,并利用事件論元抽取技術進行實例事理元素抽取,形成實例事理邏輯知識庫;
構建具有層級性的抽象概念知識庫;
利用抽象概念知識庫對實例事理邏輯知識庫中的實例事件進行實體詞抽象和謂詞性抽象,形成抽象事理圖譜;
利用實體知識圖譜,采用實體鏈接技術對實例事理邏輯知識庫中的實例事件進行實體鏈接,實現事件知識與實體知識的融合,形成事理知識圖譜;
將抽象事理圖譜與事理知識圖譜進行合并,形成領域事件圖譜。
2.根據權利要求1所述的方法,其特征在于,所述事理關系抽取,包括抽取以下八種事理關系:因果事理、條件事理、上下位事理、并列事理、互斥事理、順承事理、轉折事理、組成事理。
3.根據權利要求1所述的方法,其特征在于,所述事理關系抽取的方法包括:基于關系詞限定、詞性過濾與事件成立性的抽取方法;基于關系詞與依存句法規則的抽取方法;基于序列標注的事理抽取方法。
4.根據權利要求1所述的方法,其特征在于,所述實例事理元素抽取,包括抽取以下事理元素:核心動作,指的是事件中的核心動詞;動作主體,指圍繞核心動詞的施事者;動作客體,指圍繞核心動詞的受事者;事件發生時間,指事件發生時的背景時間;事件發生地點,指事件發生時的背景地點;事件關聯人物,指事件發生的關聯人物;事件關聯公司,指事件發生的關聯公司;事件關聯機構,指事件發生的機構實體;事件極性,指事件本身的情緒;事件確定性,指事件發生的確定性;事件權威性,指因果事件的權威性;事件發生時態,指事件發生的時態,包括已經發生,將要發生,正在發生三種狀態;事件來源,指事件抽取所在的文本來源。
5.根據權利要求1所述的方法,其特征在于,所述抽象概念知識庫是存儲概念之間上下位層級的知識庫,由名詞性實體抽象知識庫、性狀類抽象知識庫以及動作性事件抽象知識庫三個知識庫構成;通過融合HowNet、同義詞詞林、百科類層級分類樹、百科詞條義項和領域詞表,形成具有層級性的抽象概念知識庫。
6.根據權利要求1所述的方法,其特征在于,所述抽象事理圖譜,是運用事件抽象的方法對實例事理邏輯知識庫的事件進行抽象,最終形成具有抽象層級性的抽象事理圖譜,包括事件預處理、事件成分抽象和抽象成分融合三個步驟。
7.根據權利要求1所述的方法,其特征在于,所述事理知識圖譜是事件知識與實體知識之間的融合,通過將實例事理邏輯知識庫與實體知識圖譜之間進行鏈接,形成從事件知識到實體知識的通路。
8.根據權利要求1所述的方法,其特征在于,所述領域事件圖譜是一個有向有環圖,節點代表事件,有向邊代表事件之間的事理關系;所述領域事件圖譜既關注事件外部之間的演化邏輯關系,又關注事件本身的豐富屬性信息,是抽象事件與事件知識庫兩者的統一結合體。
9.一種融合多類事理與實體知識的領域事件圖譜構建裝置,其特征在于,包括:
實例事理邏輯知識庫構建模塊,負責對領域語料庫進行事理關系抽取,并利用事件論元抽取技術進行實例事理元素抽取,形成實例事理邏輯知識庫;
抽象概念知識庫構建模塊,負責構建具有層級性的抽象概念知識庫;
抽象事理圖譜構建模塊,負責利用抽象概念知識庫對實例事理邏輯知識庫中的實例事件進行實體詞抽象和謂詞性抽象,形成抽象事理圖譜;
事理知識圖譜構建模塊,負責利用實體知識圖譜,采用實體鏈接技術對實例事理邏輯知識庫中的實例事件進行實體鏈接,實現事件知識與實體知識的融合,形成事理知識圖譜;
領域事件圖譜構建模塊,負責將抽象事理圖譜與事理知識圖譜進行合并,形成領域事件圖譜。
10.一種計算機,其特征在于,包括存儲器和處理器,所述存儲器存儲計算機程序,所述計算機程序被配置為由所述處理器執行,所述計算機程序包括用于執行權利要求1~8中任一權利要求所述方法的指令。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于數地工場(南京)科技有限公司,未經數地工場(南京)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911059404.7/1.html,轉載請聲明來源鉆瓜專利網。





