[發明專利]一種基于深度學習與相似度匹配的知識圖譜問答的方法在審
| 申請號: | 202011446662.3 | 申請日: | 2020-12-11 |
| 公開(公告)號: | CN112765310A | 公開(公告)日: | 2021-05-07 |
| 發明(設計)人: | 李小超;張晶亮;謝水庚;胡博欽;郝志強 | 申請(專利權)人: | 北京航天云路有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/332;G06F16/35;G06F16/36;G06F40/211;G06F40/242;G06F40/295;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京紐樂康知識產權代理事務所(普通合伙) 11210 | 代理人: | 秦月貞 |
| 地址: | 100039 北京市海淀區西*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 相似 匹配 知識 圖譜 問答 方法 | ||
本發明公開了一種基于深度學習與相似度匹配的知識圖譜問答的方法,包括,進行啟動服務,加載訓練好的多標簽分類模型;對用戶的輸入問句進行實體類別的識別;預測出該問句對應的某一個或多個實體標簽:云端業務工作室;獲取用戶問句對應的實體名稱:發布需求,并加載該類別下的實體名稱詞典;根據實體名稱構造數據庫查詢語句;到數據庫查詢獲取答案。本發明通過利用用戶問句數據搭建了基于ALBERT與雙向GRU的多標簽分類模型,無需對數據進行實體標注,直接識別出用戶問句對應的實體標簽。區別于現有工作的命名實體識別模型,簡化了問答的方法的復雜度與計算量,并且實際測試表明本研究設計的問答的方法具備很高的識別準確度。
技術領域
本發明涉及知識圖譜問答的方法技術領域,具體來說,涉及一種基于深度學習與相似度匹配的知識圖譜問答的方法。
背景技術
隨著人們對快速、準確地獲取信息的需求越來越大,問答的方法的研究吸引了越來越多的關注。以通過關鍵詞匹配實現信息檢索作為主要方法的傳統問答技術目前存在一些技術性問題,比如搜索接口不友好、搜索過程復雜、返回信息量大、返回內容針對性不強等,而且無法從根本上解決搜索中存在的準確率低以及召回率低的問題(中國專利CN105868313A[P],一種基于模板匹配技術的知識圖譜問答的方法及方法,公開日期:2016-08-17)。隨著互聯網信息量的爆炸式增長,傳統的問答的方法已逐漸無法滿足用戶的需求。近年來,基于知識圖譜的信息檢索方式為大數據下的用戶搜索拓展了一種新的思路,基于知識圖譜的問答的方法成為研究熱點。
知識圖譜是一種具有屬性的實體對通過關系鏈接而成的結構化語義知識庫。在知識圖譜中,知識通常表示為“三元組”形式的數據結構。知識圖譜的出現實現了搜索關鍵詞的的方法化,對每一個關鍵詞都形成一個完整的知識體系,從而提高了搜索質量(中國專利CN109271506A,一種基于深度學習的電力通信領域知識圖譜問答的方法的構建方法,公開日期: 2019-01-25)。相比于傳統的搜索引擎,基于知識圖譜的問答的方法具有諸多優點,比如支持更友好的互動問答模式、返回更加精準簡潔的搜索結果、支持知識內容的累積與支持實體節點間隱式信息的顯示展現等(中國專利CN110532397A,基于人工智能的問答方法、裝置、計算機設備及存儲介質,公開日期:2019-12-03)。
目前,基于知識圖譜的問答的方法得到了快速發展。在識別用戶問句中的實體名稱或者類別時,現有的問答的方法主要采取模板匹配(中國專利 CN107729493A,旅行知識圖譜的構建方法、裝置及旅行問答方法、裝置,公開日期:2018-02-23;中國專利CN108846104A,一種基于教育知識圖譜的問答分析與處理方法及的方法,公開日期:2018-11-20;中國專利CN108804521A,一種基于知識圖譜的問答方法及農業百科問答的方法,公開日期:2018-11-13)。與深度學習(中國專利CN108509519A,基于深度學習的通用知識圖譜增強問答交互的方法及方法,公開日期:2018-09-07;中國專利CN108182262A,基于深度學習和知識圖譜的智能問答的方法構建方法和的方法,公開日期:2018-06-19;中國專利CN110457442A,面向智能電網客服問答的知識圖譜構建方法,公開日期:2019-11-15)兩類技術。采用模板匹配需要整理大量的實體詞典,而且如果用戶問句的用詞發生變化,往往會存在匹配不到的問題,造成搜索不到需要的答案;采用深度學習進行命名實體識別,需要對訓練數據進行實體標簽標注,然后訓練模型再進行實體識別,需要較大的計算量。
發明內容
針對相關技術中的上述技術問題,本發明提出一種基于深度學習與相似度匹配的知識圖譜問答的方法,能夠克服現有技術方法的上述不足。
為實現上述技術目的,本發明的技術方案是這樣實現的:
一種基于深度學習與相似度匹配的知識圖譜問答的方法,包括進行啟動服務,加載訓練好的多標簽分類模型;首先對用戶的輸入問句進行實體類別的識別;預測出該問句對應的某一個或多個實體類別為云端業務工作室,獲取用戶問句對應的實體名稱,并加載該類別下的實體名稱詞典,根據實體名稱構造數據庫查詢語句;到數據庫查詢獲取答案。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航天云路有限公司,未經北京航天云路有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011446662.3/2.html,轉載請聲明來源鉆瓜專利網。





