[發明專利]基于語義塊的知識圖譜問答方法及裝置在審
| 申請號: | 202010745796.9 | 申請日: | 2020-07-29 |
| 公開(公告)號: | CN111930906A | 公開(公告)日: | 2020-11-13 |
| 發明(設計)人: | 高留杰;張世琨;趙文;常磊磊 | 申請(專利權)人: | 北京北大軟件工程股份有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/36;G06F40/242;G06F40/30 |
| 代理公司: | 北京細軟智谷知識產權代理有限責任公司 11471 | 代理人: | 譚承世 |
| 地址: | 100089 北京市海淀區北四環西路67號中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 語義 知識 圖譜 問答 方法 裝置 | ||
1.一種基于語義塊的知識圖譜問答方法,其特征在于,包括:
獲取問句,并通過預設的知識圖譜生成上下文字典;
將所述上下文字典輸入到預訓練的圖神經網絡模型中,生成語義塊序列,根據所述語義塊序列構建語義查詢圖;
根據所述知識圖譜對所述語義查詢圖進行解析,輸出結果。
2.根據權利要求1所述的方法,其特征在于,所述通過預設的知識圖譜生成上下文字典,之前還包括:對問句進行預處理;
所述對問句進行預處理,包括:
采用WordNet將所述問句中的所有詞轉換為對應的語義詞;
基于實體鏈接方法,得到所述問句中的候選實體類別集合,并獲取實體;
對所述實體進行處理,得到候選實體類別中元素之間的關系;
建立候選實體類別中元素之間的關系集合。
3.根據權利要求2所述的方法,其特征在于,所述通過預設的知識圖譜生成上下文字典,包括:
通過問句得到所述問句關聯的候選實體類別;
通過知識圖譜得到與候選實體類別中元素之間的關系集合,得到帶有上下文信息的問題表示。
4.根據權利要求3所述的方法,其特征在于,
采用圖編碼器將輸入的上下文字典編碼為向量表示;
采用序列解碼器將所述向量表示生成語義塊序列。
5.根據權利要求4所述的方法,其特征在于,所述圖編碼器包括:
節點嵌入層,用于生成節點向量;其中,所述節點包括:問句中的單詞組成的詞典、候選實體類別詞典;
圖嵌入層,用于采用max-pooling方式生成問句圖的向量表示。
6.根據權利要求4所述的方法,其特征在于,所述序列解碼器采用:
雙向RNN模型,所述雙向RNN模型每次迭代生成一個語義塊,最終形成語義塊序列。
7.根據權利要求4所述的方法,其特征在于,所述序列解碼器包括:
語義塊解碼控制器,用于預測語義塊序列中每個語義塊包含名稱、實體類型和輸入參數三個部分的內容,采用Beam搜索,結合生成的語義塊中的參數類型,與得到的語義塊的輸出類型進行匹配,得到可以匹配的語義塊來確定序列在當前時刻的輸出。
8.根據權利要求1至7任一項所述的方法,其特征在于,所述語義塊包括以下模式:
實體模式、關系模式、屬性模式、排序模式、聚合模式、集合模式。
9.一種基于語義塊的知識圖譜問答裝置,其特征在于,包括:
獲取模塊,用于獲取問句,并通過預設的知識圖譜生成上下文字典;
生成模塊,用于將所述上下文字典輸入到預訓練的圖神經網絡模型中,生成語義塊序列,根據所述語義塊序列構建語義查詢圖;
輸出模塊,用于根據所述知識圖譜對所述語義查詢圖進行解析,輸出結果。
10.根據權利要求9所述的裝置,其特征在于,所述通過預設的知識圖譜生成上下文字典,之前還包括:
預處理模塊,用于對問句進行預處理;
所述對問句進行預處理,包括:
采用WordNet將所述問句中的所有詞轉換為對應的語義詞;
基于實體鏈接方法,得到所述問句中的候選實體類別集合,并獲取實體;
對所述實體進行處理,得到候選實體類別中元素之間的關系;
建立候選實體類別中元素之間的關系集合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京北大軟件工程股份有限公司,未經北京北大軟件工程股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010745796.9/1.html,轉載請聲明來源鉆瓜專利網。





