[發(fā)明專利]基于命名實體的文本問答方法、裝置及可讀存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202010434262.4 | 申請日: | 2020-05-20 |
| 公開(公告)號: | CN111695354A | 公開(公告)日: | 2020-09-22 |
| 發(fā)明(設(shè)計)人: | 郝新東;王科強 | 申請(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06F40/30;G06F16/332;G06F16/35;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市沃德知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 命名 實體 文本 問答 方法 裝置 可讀 存儲 介質(zhì) | ||
本發(fā)明涉及人工智能技術(shù),揭露了一種基于命名實體的文本問答方法,包括:接收用戶輸入的咨詢文本,對所述咨詢文本執(zhí)行命名實體識別得到實體文本集;獲取問答語料集,并對所述問答語料集執(zhí)行命名實體識別及命名實體劃分,得到多個問答語料子集,從多個所述問答語料子集中提取與所述咨詢文本相關(guān)的問答語料子集,組成回答文本集,并將所述回答文本集進行切分及編碼操作,得到問答編碼集,將所述問答編碼集輸入至預(yù)訓(xùn)練完成的深度學(xué)習(xí)問答模型中,得到所述咨詢文本的回答文本。本發(fā)明還提出一種基于命名實體的文本問答裝置、電子設(shè)備以及計算機可讀存儲介質(zhì)。本發(fā)明可以解決文本回答過程計算量大,回答效果差的問題。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能技術(shù)領(lǐng)域,尤其涉及一種基于命名實體的文本問答的方法、裝置、電子設(shè)備及可讀存儲介質(zhì)。
背景技術(shù)
隨著近年大數(shù)據(jù)以及人工智能技術(shù)在各行各業(yè)的普及與發(fā)展,各行各業(yè)的智能場景層出不窮,其中問答系統(tǒng)為主要的智能場景代表。
目前問答系統(tǒng)主要有下述兩種:一、以詞向量轉(zhuǎn)變方法為基礎(chǔ),先將用戶輸入文本轉(zhuǎn)變?yōu)樵~向量,并計算與詞庫的文本向量在空間距離的大小,并選擇空間距離最小的詞庫文本完成問答;二、以深度學(xué)習(xí)模型為基礎(chǔ)完成問答。其中第一種以詞向量轉(zhuǎn)變方法為基礎(chǔ)的問答系統(tǒng),由于方法簡單往往答非所問無法滿足當(dāng)前場景的要求,而第二種以深度學(xué)習(xí)模型為基礎(chǔ)的問答系統(tǒng)雖然可滿足當(dāng)前場景的要求,但由于深度學(xué)習(xí)模型需要進行大量的數(shù)據(jù)計算,若多個用戶同時使用問答系統(tǒng)時,由于計算量高,問答系統(tǒng)往往不能及時響應(yīng),時效性較差。
發(fā)明內(nèi)容
本發(fā)明提供一種基于命名實體的文本問答方法、裝置、電子設(shè)備及計算機可讀存儲介質(zhì),其主要目的解決文本回答過程計算量大,回答效果差的問題。
為實現(xiàn)上述目的,本發(fā)明提供的一種基于命名實體的文本問答方法,包括:
接收用戶輸入的咨詢文本,對所述咨詢文本執(zhí)行命名實體識別得到實體文本集;
獲取問答語料集,并對所述問答語料集執(zhí)行命名實體識別及命名實體劃分,得到多個問答語料子集;
從多個所述問答語料子集中提取與所述咨詢文本相關(guān)的問答語料子集,組成回答文本集,并將所述回答文本集進行切分及編碼操作,得到問答編碼集;
將所述問答編碼集輸入至預(yù)訓(xùn)練完成的深度學(xué)習(xí)問答模型中,得到所述咨詢文本的回答文本。
可選地,將所述回答文本集進行切分及編碼操作,得到問答編碼集,包括:
根據(jù)預(yù)構(gòu)建的切分詞典,對所述回答文本集執(zhí)行切分操作得到問答詞組集;
對所述問答詞組集執(zhí)行所述編碼操作得到問答編碼集。
可選地,根據(jù)預(yù)構(gòu)建的切分詞典,對所述回答文本集執(zhí)行切分操作得到問答詞組集,包括:
步驟Ⅰ:提取所述回答文本集內(nèi)每個回答文本;
步驟Ⅱ:按照預(yù)設(shè)的切分規(guī)則,對所述回答文本進行切分得到回答切分詞;
步驟Ⅲ:判斷所述回答切分詞在所述切分詞典是否出現(xiàn),若所述回答切分詞在所述切分詞典不出現(xiàn),返回步驟Ⅱ;
步驟Ⅳ:若所述回答切分詞在所述切分詞典出現(xiàn),繼續(xù)對所述回答文本進行切分,直至所述回答文本集提取完成得到所述問答詞組集。
可選地,該方法還包括訓(xùn)練所述深度學(xué)習(xí)問答模型,其中所述訓(xùn)練包括:
步驟A:根據(jù)預(yù)先設(shè)定的網(wǎng)絡(luò)組合權(quán)重函數(shù),對多組長短期記憶網(wǎng)絡(luò)進行組合得到待訓(xùn)練深度學(xué)習(xí)問答模型,并獲取問答訓(xùn)練集和問答標(biāo)簽集,將所述問答訓(xùn)練集輸入至所述待訓(xùn)練深度學(xué)習(xí)問答模型;
步驟B:計算每組長短期記憶網(wǎng)絡(luò)之間的關(guān)聯(lián)權(quán)重得到關(guān)聯(lián)權(quán)重集;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010434262.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





