[發明專利]一種多粒度注意力機制的知識庫問答關系檢測方法及系統在審
| 申請號: | 202010904078.1 | 申請日: | 2020-09-01 |
| 公開(公告)號: | CN112100348A | 公開(公告)日: | 2020-12-18 |
| 發明(設計)人: | 何儒漢;唐嬌;陳佳;彭濤;張自力;陳常念;劉軍平;胡新榮 | 申請(專利權)人: | 武漢紡織大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F40/30;G06F40/295;G06N3/04 |
| 代理公司: | 北京金智普華知識產權代理有限公司 11401 | 代理人: | 楊采良 |
| 地址: | 430200 湖北省武漢市*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 粒度 注意力 機制 知識庫 問答 關系 檢測 方法 系統 | ||
1.一種多粒度注意力機制的知識庫問答關系檢測方法,應用于客戶端,其特征在于,所述多粒度注意力機制的知識庫問答關系檢測方法包括:
使用Glove算法將問題和候選關系轉換成詞嵌入,從詞級、關系級兩種粒度建立關系表示獲取豐富的關系語義,并引入注意機制實現關系檢測中字符之間的細粒度對齊;
計算問題向量和候選關系向量的語義相似性,語義相似性最高的候選關系所連接的答案即為正確答案。
2.如權利要求1所述的多粒度注意力機制的知識庫問答關系檢測方法,其特征在于,使用Glove算法將問題和候選關系轉換成詞嵌入,從詞級、關系級兩種粒度建立關系表示獲取豐富的關系語義中,包括:將問題中的實體用entity代替轉換為問題模式P,先將每個單詞用Glove預訓練成詞向量表示,再使用一個雙向的GRU網絡對詞向量進行編碼以獲得問題的上下文表示;問題和關系中的單詞具有相同的詞嵌入,問題編碼定義如下:
P=Bi-GRU([w1,w2,w3,…wQ])。
3.如權利要求1所述的多粒度注意力機制的知識庫問答關系檢測方法,其特征在于,使用Glove算法將問題和候選關系轉換成詞嵌入,從詞級、關系級兩種粒度建立關系表示獲取豐富的關系語義中,進一步包括:
從單詞級和關系級來進行編碼,對于候選關系R中的每個關系r,使用Glove模型轉換為訓練的詞嵌入,詞級將候選關系中的每一個單詞視為token,單詞級關注詞和短語的信息,不同的詞匹配不同長度的短語,但缺乏相對原始的全局信息;
關系級將整個關系名稱視為token,當將關系名作為單個標記處理時,不能將問題與關系名匹配,關系名匹配問題中較長的短語,關注全局信息;
單詞級輸入的關系為rw={r1w,r2w,r3w},關系級輸入的關系為rrel,整個模型輸入關系視為為r={rw,rrel};
最后結合一個雙向的GRU網絡表示單詞及上下文,關系的上下文感知表示定義如下:
r=Bi-GRU([r1,r2,r3,…rR])。
4.如權利要求1所述的多粒度注意力機制的知識庫問答關系檢測方法,其特征在于,引入注意機制實現關系檢測中字符之間的細粒度對齊中,注意力機制學習問題與關系之間的細粒度交互,關系的每個部分對問題的關注程度不同決定問題如何表示,將注意的程度作為問題中每個單詞的權重;對于候選關系中的每一個關系ri,問題模式wi的注意力表示Pi計算如下:
wij=vT·pi·WT·rj
式中,wij代表問題模式中單詞wi和候選關系中單詞rj之間的相似度,v和W均是可學習的矩陣,ai,j是問題中單詞與關系之間的注意權重,代表問題中第i個單詞對關系中第j個單詞的注意力權重。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢紡織大學,未經武漢紡織大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010904078.1/1.html,轉載請聲明來源鉆瓜專利網。





