[發(fā)明專利]基于深度學習的通用知識圖譜增強問答交互系統(tǒng)及方法有效
| 申請?zhí)枺?/td> | 201810196192.6 | 申請日: | 2018-03-09 |
| 公開(公告)號: | CN108509519B | 公開(公告)日: | 2021-03-09 |
| 發(fā)明(設計)人: | 宋美娜;鄂海紅;張崇宇 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F40/30;G06N5/02;G06N20/00 |
| 代理公司: | 北京清亦華知識產(chǎn)權代理事務所(普通合伙) 11201 | 代理人: | 張潤 |
| 地址: | 100876 北京市海淀區(qū)西*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 學習 通用 知識 圖譜 增強 問答 交互 系統(tǒng) 方法 | ||
本發(fā)明公開了一種基于深度學習的通用知識圖譜增強問答交互系統(tǒng)及方法,其中,系統(tǒng)包括:擴展知識圖譜混合問答模塊用于得到擴展知識圖譜;知識庫問題生成模塊分別生成不同問題對應的答案,使得生成多個問題?答案對;web交互界面,用于獲取用戶問題;知識圖譜問答模塊,獲取用戶問題對應的答案的類型,并得到用戶問題對應的數(shù)值向量;知識深度推理模塊,用于對用戶問題對應的答案的類型和用戶問題對應的數(shù)值向量進行知識檢索與推理,并根據(jù)檢索與推理的結果與多個問題?答案對得到用戶問題的目標答案。該系統(tǒng)可以有效提高問答系統(tǒng)的性能、可操作性、語義理解分析能力、綜合問答擴展能力和通用技術共享能力,提高生成答案的準確性。
技術領域
本發(fā)明涉及機器學習技術領域,特別涉及一種基于深度學習的通用知識圖譜增強問答交互系統(tǒng)機方法。
背景技術
隨著大數(shù)據(jù)和知識工程的發(fā)展,將逐漸形成數(shù)據(jù)驅動與知識驅動相結合的計算范式,越來越多的通過信息抽取、知識融合及知識加工等技術將海量的非結構化數(shù)據(jù)構建為知識圖譜,使得海量的數(shù)據(jù)信息表達成更接近人類認知世界的形式,提供了一種更好地組織、管理和理解海量信息的能力。基于知識圖譜的問答系統(tǒng)成為學術界和工業(yè)界的研究和應用熱點方向。目前面向知識圖譜的問答系統(tǒng)常用的是組合范疇語法、依存組合語法等問句語義解析方法,問題模板匹配,一階邏輯表示,SPARQL查詢等方法。
自然語言形式的問答正逐漸成為一種人與機器進行交互的新趨勢,處于從文本關鍵詞淺層語義搜索提升到基于智能化深度問答的深刻變革中。知識圖譜提供了一種更好地組織、管理和理解海量信息的能力。面向知識圖譜的問答能夠保證系統(tǒng)答案的推理性及準確性,可有效應對知識的不確定性、多樣性和復雜性問題。但是目前面向知識圖譜的問答系統(tǒng)在知識表示方法上常用的是基于產(chǎn)生式規(guī)則、邏輯表示、框架表示、語義網(wǎng)絡、本體等方法,在查詢檢索上主要是模板匹配、語義邏輯表達式、SPARQL查詢等方法。這些方法不僅需要大量人工方法的介入,而且在問句和知識的深層次語義解析上效果欠佳。在自動問答領域,將流行的深度學習模型投入應用后,其可學習特性和深層語義理解的效果得到了廣泛認可,但是基于深度學習的問答仍然存在缺少訓練語料資源,對復雜問題的回答能力尚且不足等問題。
相關技術提供了基于知識圖譜的人機問答方法和系統(tǒng),通過對用戶輸入的語句進行分詞;對通過所述分詞所得到的詞進行實體抽取;利用知識圖譜對通過所述實體抽取所得到的實體信息進行知識推理;以及根據(jù)所述知識推理的結果對所述用戶輸入的語句給出反饋。另外,相關技術公開了一種基于模板匹配技術的知識圖譜問答系統(tǒng)和方法,通過對用戶的問句進行語法分析,將語法分析后的結果到離線定義的手工模板庫中尋找匹配的問句模板,根據(jù)所述的實體匹配方法和關系匹配方法,生成最終的結構化的知識圖譜查詢語句,根據(jù)該結構化查詢語句到知識圖譜中進行檢索,返回最終的結果。
相關技術還公開了一種基于知識圖譜的廚房領域問答方法及系統(tǒng),獲取問句并對問句進行分詞處理得到分詞結果;根據(jù)上下文特征對分詞結果進行實體及屬性抽取,并生成問句對應的語義邏輯表達式;根據(jù)語義邏輯表達式生成SPARQL查詢語句;根據(jù)SPARQL查詢語句在廚房領域知識圖譜中查詢得到結果并根據(jù)結果得到問句對應的答案。相關技術公開了一種基于知識圖譜的自然語言問題實現(xiàn)方法和系統(tǒng),包括:復雜問題解析單元,用于接受用戶提出自然語言問題,并對問題進行解析,如果問題是復雜性問題,則將其分解為一系列的二元事實型問題;概率推導單元,用于對每一個二元事實型問題,用概率推算的方法來找它的值;知識圖譜查詢單元,用于從從預先訓練的知識圖譜中找到并返回答案。
然而,相關技術的知識圖譜問答系統(tǒng)存在的主要問題是:目前大多數(shù)領域知識圖譜問答通常采用模板匹配,語義邏輯表達式SPARQL查詢,復雜問題拆解,簡單推理等方法,這些方法需要消耗大量的人工成本,且處在淺層語義解析,簡單知識推理的層面,主要體現(xiàn)在事實型問題的處理上。
發(fā)明內容
本發(fā)明旨在至少在一定程度上解決相關技術中的技術問題之一。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經(jīng)北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810196192.6/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





