[發明專利]基于語義塊的知識圖譜問答方法及裝置在審
| 申請號: | 202010745796.9 | 申請日: | 2020-07-29 |
| 公開(公告)號: | CN111930906A | 公開(公告)日: | 2020-11-13 |
| 發明(設計)人: | 高留杰;張世琨;趙文;常磊磊 | 申請(專利權)人: | 北京北大軟件工程股份有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/36;G06F40/242;G06F40/30 |
| 代理公司: | 北京細軟智谷知識產權代理有限責任公司 11471 | 代理人: | 譚承世 |
| 地址: | 100089 北京市海淀區北四環西路67號中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 語義 知識 圖譜 問答 方法 裝置 | ||
本發明涉及一種基于語義塊的知識圖譜問答方法及裝置,包括獲取問句,并通過預設的知識圖譜生成上下文字典;將上下文字典輸入到預訓練的圖神經網絡模型中,生成語義塊序列,根據語義塊序列構建語義查詢圖;根據知識圖譜對語義查詢圖進行解析,輸出結果。本發明通過構造問句的上下文詞典附加到圖神經網絡中,有效解決了隱式實體和關系挑戰,改進了語義解析的效果。通過構建的語義查詢圖生成問題的邏輯形式,能夠快速的在知識庫中檢索出答案。結合基于規則的準確度和基于深度學習的覆蓋度,通過構建語義塊的形式改進問句中的約束條件和多意圖組合,使得問題語義塊的解析不依賴于問答輸出的邏輯形式,具有較強的適應性。
技術領域
本發明屬于語言技術領域,具體涉及一種基于語義塊的知識圖譜問答方法及裝置。
背景技術
語義解析的作用是能夠讓計算機理解自然語言中的語義信息,用來在知識庫中匹配相對應的語義類型。在基于知識圖譜的自然語言問答的研究中,語義解析是非常重要的一個步驟,更精準的語義理解能夠使計算機識別問句意圖并返回相應的答案。隨著神經網絡和知識圖譜的廣泛應用,基于知識圖譜的自然語言問答被深入研究。
知識圖譜問答需要計算機理解自然語言的語義信息,其核心在于問句語義和知識語義的理解和相似度計算。近年來,隨著深度學習在自然語言處理領域的快速發展及其在問答任務上的良好表現,利用深度神經網絡來改進面向知識圖譜的問答成為研究的主要方向?,F在大多數的問答場景都是依據領域而建,相比于通用問答場景,聚焦于領域能夠提高問答的準確性。
領域知識圖譜問答一般圍繞領域相關問題進行,問題的理解可以劃分為三個子任務:實體鏈接、關系識別以及邏輯和數字操作相關的約束條件標識。在現有的知識圖譜問答中還存在以下幾個解析問題:
1、隱式實體和關系,領域問答場景較固定,在進行問答時,會省略一些實體和關系,默認為這就是領域中的上下文信息。
2、約束條件,知識圖譜中存在大量時間、排序、聚合等約束條件,對問句的語義理解造成了困難。
3、多意圖組合,問題一般由多個意圖組合而成,每個意圖表示了對預期結果的一種限定,特定領域的問答意圖較集中,通過不同的組合方式來實現復雜的問題意圖,如何通過拆分意圖來實現語義解析也是一個大的問題。
發明內容
有鑒于此,本發明的目的在于克服現有技術的不足,提供一種基于語義塊的知識圖譜問答方法及裝置,以解決現有技術中語義解析的問題。
為實現以上目的,本發明采用如下技術方案:一種基于語義塊的知識圖譜問答方法,包括:
獲取問句,并通過預設的知識圖譜生成上下文字典;
將所述上下文字典輸入到預訓練的圖神經網絡模型中,生成語義塊序列,根據所述語義塊序列構建語義查詢圖;
根據所述知識圖譜對所述語義查詢圖進行解析,輸出結果。
進一步的,所述通過預設的知識圖譜生成上下文字典,之前還包括:對問句進行預處理;
所述對問句進行預處理,包括:
采用WordNet將所述問句中的所有詞轉換為對應的語義詞;
基于實體鏈接方法,得到所述問句中的候選實體類別集合,并獲取實體;
對所述實體進行處理,得到候選實體類別中元素之間的關系;
建立候選實體類別中元素之間的關系集合。
進一步的,所述通過預設的知識圖譜生成上下文字典,包括:
通過問句得到所述問句關聯的候選實體類別;
通過知識圖譜得到與候選實體類別中元素之間的關系集合,得到帶有上下文信息的問題表示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京北大軟件工程股份有限公司,未經北京北大軟件工程股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010745796.9/2.html,轉載請聲明來源鉆瓜專利網。





