[發(fā)明專利]基于深度學習技術(shù)的知識圖譜問答方法、裝置及設(shè)備在審
| 申請?zhí)枺?/td> | 202010550506.5 | 申請日: | 2020-06-16 |
| 公開(公告)號: | CN111506722A | 公開(公告)日: | 2020-08-07 |
| 發(fā)明(設(shè)計)人: | 張圣 | 申請(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/36;G06F40/211;G06F40/295;G06F40/35;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市明日今典知識產(chǎn)權(quán)代理事務所(普通合伙) 44343 | 代理人: | 王杰輝 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 深度 學習 技術(shù) 知識 圖譜 問答 方法 裝置 設(shè)備 | ||
本申請揭示了一種基于深度學習技術(shù)的知識圖譜問答方法、裝置及設(shè)備,其中方法包括:接收用戶的問題語句;利用基于LSTM+CRF的序列標注模型對所述問題語句進行實體識別,得到所述問題語句中的實體信息;利用屬性識別模型對問題語句進行屬性識別,得到問題語句中的屬性信息;對屬性信息進行屬性拓展和屬性標準化,得到對應到知識圖譜中的標準屬性;根據(jù)實體信息和標準屬性生成知識圖譜的結(jié)構(gòu)化查詢,在知識圖譜中查詢答案,將查詢到的答案返回給用戶。模型和知識圖譜信息可以存儲于區(qū)塊鏈中。本申請的基于深度學習技術(shù)的知識圖譜問答方法通過多層Bi?LSTM及Attention操作很好地將實體層、短語層、問題層的語義信息融入到模型中,提高了模型的效果和問答的準確性。
技術(shù)領(lǐng)域
本申請涉及到自然語言處理技術(shù)領(lǐng)域,特別是涉及到一種基于深度學習技術(shù)的知識圖譜問答方法、裝置及設(shè)備。
背景技術(shù)
問答系統(tǒng)是用來回答人提出的自然語言的問題的系統(tǒng),對于問答系統(tǒng)而言用戶的問題基本可以分成事實型問題和觀點型問題,事實型問題是指存在標準答案的問題,比如“乙肝疫苗的免疫原理是什么?”。觀點型問題的答案一般不存在唯一標準答案,比如“疫苗是打國內(nèi)的好還是國外的好?”,事實型問題是在問答系統(tǒng)中關(guān)注較多的一種,但目前問答系統(tǒng)中最常用的技術(shù)是基于信息檢索技術(shù)的問答系統(tǒng),主要是通過關(guān)鍵詞搜索以及提取答案,由于自然語言文本的復雜性,該方法實現(xiàn)問答準確率很低。
目前已經(jīng)出現(xiàn)了基于知識圖譜的問答技術(shù),然而,現(xiàn)有的基于知識圖譜問答技術(shù),實際應用落地過程中多是基于設(shè)計的規(guī)則,或者是簡單的機器學習模型,基于復雜模型復雜度較高,真實上線需要機器和時間成本高,效果提升不明顯。
發(fā)明內(nèi)容
本申請的主要目的為提供一種基于深度學習技術(shù)的知識圖譜問答方法、裝置及設(shè)備,旨在解決現(xiàn)有技術(shù)中基于知識圖譜的問答系統(tǒng)效果較差、硬件成本較高的技術(shù)問題。
為了實現(xiàn)上述發(fā)明目的,本申請?zhí)岢鲆环N基于深度學習技術(shù)的知識圖譜問答方法,包括:
接收用戶的問題語句;
利用基于LSTM+CRF的序列標注模型對所述問題語句進行實體識別,得到所述問題語句中的實體信息;
利用基于注意力機制的屬性識別模型對所述問題語句進行屬性識別,得到所述問題語句中的屬性信息;
對所述屬性信息進行屬性拓展和屬性標準化,得到對應到知識圖譜中的標準屬性;
根據(jù)所述實體信息和所述標準屬性生成知識圖譜的結(jié)構(gòu)化查詢,在知識圖譜中查詢答案,將查詢到的答案返回給用戶。
進一步地,所述利用基于LSTM+CRF的序列標注模型對所述問題語句進行實體識別,得到所述問題語句中的實體信息步驟,包括:
先將所述問題語句分詞,輸入實體識別模型的Token Embedding層,將單詞轉(zhuǎn)化為詞向量;
將詞向量輸入到實體識別模型的Bi-LSTM層,得到第一隱藏向量;
將第一隱藏向量輸入到實體識別模型的CRF層,得到預測標簽序列;
根據(jù)預測標簽序列確定所述問題語句中的實體信息。
進一步地,所述利用基于注意力機制的屬性識別模型對所述問題語句進行屬性識別,得到所述問題語句中的屬性信息的步驟包括:
對所述問題語句進行分詞處理得到詞序列,通過Word Embedding獲取每個詞的詞向量w1,w2...,wn;
將詞向量w1,w2...,wn映射成對應的概念詞向量e1,e2...,en;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010550506.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





