[發明專利]一種基于GCN與指針網絡的自然語言到SPARQL語句的生成系統及方法有效
| 申請號: | 202011642734.1 | 申請日: | 2020-12-30 |
| 公開(公告)號: | CN112632263B | 公開(公告)日: | 2023-01-03 |
| 發明(設計)人: | 姜洪超;金莉 | 申請(專利權)人: | 西安交通大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F16/36;G06F40/284;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 賀小停 |
| 地址: | 710049 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 gcn 指針 網絡 自然語言 sparql 語句 生成 系統 方法 | ||
1.一種基于GCN與指針網絡的自然語言到SPARQL語句的生成方法,其特征在于,包括以下步驟:
步驟1,接收用戶問題語句;
步驟2,根據用戶問題語句獲取問題語句圖;
步驟3,利用GCN神經網絡模型對步驟2中得到的問題語句圖進行訓練,獲得問題語句圖中每個節點對應的圖嵌入向量;
步驟4,搭建指針網絡架構,所述指針網絡架構包括編碼端、Attention層和解碼端,其中,編碼端為Bi-LSTM模型;解碼端為LSTM模型;Attention層包括全連接層和Softmax層;
構建輸入序列,并設定該輸入序列的單元數為n;
步驟5,對步驟4中得到的輸入序列進行編碼,得到輸入序列編碼向量;將輸入序列編碼向量與步驟3中得到的圖嵌入向量進行拼接,得到編碼拼接向量;
將得到的編碼拼接向量輸入步驟4中得到的指針網絡架構的編碼端,獲得Bi-LSTM模型n個單元輸出向量、1個正向隱向量和1個反向隱向量;
步驟6,根據步驟5得到的Bi-LSTM模型單元輸出向量、正向隱向量和反向隱向量,結合步驟4中得到指針網絡架構的Attention層,得到輸入序列每個單元的權重;
根據得到的最大權重對應的輸入序列單元,結合步驟4中得到指針網絡架構的解碼端,生成SPARQL語句;
步驟2中,根據用戶問題語句獲取問題語句圖,具體方法是:
S201、利用BERT+CRF模型對接收到的問題語句分別進行實體識別和屬性識別,分別得到實體信息和屬性信息;
S202、利用知識圖譜獲取S201中得到的實體信息和屬性信息對應的子圖,并將該子圖作為問題語句圖;
步驟6中,根據步驟5得到的單元輸出向量、正向隱向量和反向隱向量,結合步驟4中得到指針網絡架構的Attention層,得到輸入序列每個單元的權重,具體方法是:
S601、將步驟5得到的正向隱向量和反向隱向量進行拼接,獲得1個拼接向量;
S602,將S601中獲得的拼接向量進行復制,其數量與步驟4中設定的輸入序列的單元數的數量相同,得到n個拼接向量;
S603,將得到的n個拼接向量與步驟5得到的n個單元輸出向量分別進行一一拼接,獲得n個新拼接向量;
S604、將S603中獲得的n個新拼接向量分別輸入步驟4中Attention層中的n個全連接層,獲得n個全連接層向量;
S605、將S604中獲得的n個全連接層向量輸入步驟4中Attention層中的Softmax層,得到輸入序列中的每個單元的權重;
步驟6中,根據得到的最大權重對應的輸入序列單元,結合步驟4中得到指針網絡架構的解碼端,生成SPARQL語句,具體方法是:
S606、將得到的最大權重對應的輸入序列單元作為輸出序列初始單元;
S607、在步驟5中得到的n個單元輸出向量中獲取S606獲得的輸出序列初始單元所對應的單元輸出向量,并將該對應的單元輸出向量與S601獲得的拼接向量輸入至解碼端的初始單元,獲得初始單元輸出隱向量;
S608、將S607獲得的初始單元輸出隱向量作為S601中的拼接向量,重復S602—S607步驟,直到最大權重對應的輸入序列單元為標識符end,指針網絡架構解碼結束,匯總輸出序列所有單元輸出即為最終生成的SPARQL語句。
2.根據權利要求1所述的一種基于GCN與指針網絡的自然語言到SPARQL語句的生成方法,其特征在于,步驟3中,利用GCN神經網絡模型對步驟2中得到的問題語句圖進行訓練,獲得問題語句圖中每個節點對應的圖嵌入向量,具體方法是:
S301、利用Word2vec預訓練詞向量對步驟2中得到的問題語句圖中每個節點進行向量初始化,得到每個節點對應的初始化向量;
S302、利用GCN神經網絡模型對S301中每個初始化向量進行訓練更新,獲得問題語句圖中每個節點對應的圖嵌入向量。
3.根據權利要求1所述的一種基于GCN與指針網絡的自然語言到SPARQL語句的生成方法,其特征在于,步驟4中,構建得到的輸入序列由SPARQL的關鍵字表、步驟3中獲得的問題語句圖中所有節點對應的實體、邊對應的屬性以及end標識符組成。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學,未經西安交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011642734.1/1.html,轉載請聲明來源鉆瓜專利網。





