[發明專利]基于問句和知識圖結構分析的自然語言問答方法及系統有效
| 申請號: | 201711204633.4 | 申請日: | 2017-11-27 |
| 公開(公告)號: | CN108052547B | 公開(公告)日: | 2019-09-27 |
| 發明(設計)人: | 袁平鵬;金海;李高峰 | 申請(專利權)人: | 華中科技大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F17/27 |
| 代理公司: | 華中科技大學專利中心 42201 | 代理人: | 廖盈春;李智 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 問句 知識 結構 分析 自然語言 問答 方法 系統 | ||
1.一種基于問句和知識圖結構分析的自然語言問答方法,其特征在于,包括:
(1)識別自然語言問句中的命名實體,并對所述自然語言問句進行解析以構建解析樹;
(2)在所述解析樹中采用以所述命名實體中的元素為中心的方式進行遍歷,在遍歷過程中依據預設關系抽取規則從所述解析樹中抽取目標信息,構建所述自然語言問句的查詢圖;
(3)對于所述查詢圖中的每個節點,構建在預設知識圖中與所述查詢圖中各節點相匹配的節點候選集;
(4)在所述預設知識圖中以所述節點候選集中的每一個節點為中心進行遍歷,得到以所述節點候選集中的每一個節點為中心的覆蓋所有答案的子圖;
(5)針對所述預設知識圖中的路徑構建路徑語義向量,針對所述查詢圖中的邊屬性構建邊屬性語義向量;
(6)根據所述邊屬性語義向量與所述路徑語義向量,計算所述查詢圖中的邊與該邊在所述知識圖中相匹配的路徑之間的相似度,過濾掉不滿足預設相似度要求的子圖得到候選答案子圖;
(7)根據所述查詢圖中的邊與該邊在所述知識圖中相匹配的路徑之間的相似度,得到各候選答案子圖的整體相似度,確定出整體相似度較高的前k個答案;
步驟(2)具體包括:
(2.1)根據識別到的全部命名實體設置實體集合;
(2.2)設置遍歷過程關系提取集合,其中,所述遍歷過程關系提取集合中的關系屬性按照權重遞減的順序排列為:subj,obj,nsubj,iobj,dobj,pobj,nsubjpass,csubjpass,nmod:*,xsubj,prep:*,amod;
(2.3)判斷所述實體集合中是否存在未被訪問過的元素,若存在未被訪問過的元素,則執行步驟(2.4),否則結束;
(2.4)以所述未被訪問過的元素為根節點,在所述解析樹中進行遍歷搜索;
(2.5)在遍歷過程中,判斷所述解析樹中表示關系的邊的屬性是否存在于所述遍歷過程關系提取集合的關系屬性中,若不存在,則執行步驟(2.4),若存在多個關系屬性,則選擇權重最高的關系屬性所關聯的邊,然后執行步驟(2.6);
(2.6)判斷權重最高的關系屬性所關聯的邊所連接的節點是表示關系,還是表示實體,若表示關系,則在所述查詢圖中相應節點插入一條邊;若表示實體,則執行步驟(2.7);
(2.7)將所述解析樹中表示關系的邊所連接的節點表示的實體插入到所述查詢圖中,并判斷該插入的實體是否存在于所述實體集合中,若存在,則執行步驟(2.3),若不存在,則執行步驟(2.8);
(2.8)將該插入的實體插入到所述實體集合中,返回執行步驟(2.3)。
2.根據權利要求1所述的方法,其特征在于,步驟(5)具體包括:
(5.1)采用詞向量技術訓練得到預設詞匯庫中詞匯的詞向量;
(5.2)若獲取所述預設知識圖中路徑的向量表示,則執行步驟(5.3),若獲取所述查詢圖中表示關系的短語的向量表示,則執行步驟(5.4);
(5.3)求取所述知識圖的路徑中各個邊的屬性的向量表示,然后將所有邊的向量疊加來獲取所述知識圖的路徑的向量表示;
(5.4)區分所述查詢圖中表示關系的短語的核心詞和修飾詞,將所述修飾詞的詞向量映射到所述核心詞的詞向量中,以得到所述查詢圖中表示關系的短語的向量表示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中科技大學,未經華中科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711204633.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種定制客戶端用戶界面的方法及裝置
- 下一篇:碳氫化合物的鹵化





