[發明專利]基于命名實體的文本問答方法、裝置及可讀存儲介質在審
| 申請號: | 202010434262.4 | 申請日: | 2020-05-20 |
| 公開(公告)號: | CN111695354A | 公開(公告)日: | 2020-09-22 |
| 發明(設計)人: | 郝新東;王科強 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06F40/30;G06F16/332;G06F16/35;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市沃德知識產權代理事務所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 命名 實體 文本 問答 方法 裝置 可讀 存儲 介質 | ||
1.一種基于命名實體的文本問答方法,其特征在于,所述方法包括:
接收用戶輸入的咨詢文本,對所述咨詢文本執行命名實體識別,得到實體文本集;
獲取問答語料集,并對所述問答語料集執行命名實體識別及命名實體劃分,得到多個問答語料子集;
從多個所述問答語料子集中提取與所述咨詢文本相關的問答語料子集,組成回答文本集,并將所述回答文本集進行切分及編碼操作,得到問答編碼集;
將所述問答編碼集輸入至預訓練完成的深度學習問答模型中,得到所述咨詢文本的回答文本。
2.如權利要求1所述的基于命名實體的文本問答方法,其特征在于,所述將所述回答文本集進行切分及編碼操作,得到問答編碼集,包括:
根據預構建的切分詞典,對所述回答文本集執行切分操作得到問答詞組集;
對所述問答詞組集執行所述編碼操作得到問答編碼集。
3.如權利要求2所述的基于命名實體的文本問答方法,其特征在于,所述根據預構建的切分詞典,對所述回答文本集執行切分操作得到問答詞組集,包括:
步驟Ⅰ:提取所述回答文本集內每個回答文本;
步驟Ⅱ:按照預設的切分規則,對所述回答文本進行切分得到回答切分詞;
步驟Ⅲ:判斷所述回答切分詞在所述切分詞典是否出現,若所述回答切分詞在所述切分詞典不出現,返回步驟Ⅱ;
步驟Ⅳ:若所述回答切分詞在所述切分詞典出現,繼續對所述回答文本進行切分,直至所述回答文本集提取完成得到所述問答詞組集。
4.如權利要求1所述的基于命名實體的文本問答方法,其特征在于,該方法還包括訓練所述深度學習問答模型,其中所述訓練包括:
步驟A:根據預先設定的網絡組合權重函數,對多組長短期記憶網絡進行組合得到待訓練深度學習問答模型,并獲取問答訓練集和問答標簽集,將所述問答訓練集輸入至所述待訓練深度學習問答模型;
步驟B:計算每組長短期記憶網絡之間的關聯權重得到關聯權重集;
步驟C:對所述關聯權重集的進行加權求和及激活處理得到問答預測集;
步驟D:計算所述問答預測集和所述問答標簽集的誤差值,若所述誤差值大于預設的誤差閾值,根據預構建的優化函數,重新計算每組長短期記憶網絡之間的關聯權重得到關聯權重集,并返回步驟C;
步驟E:若所述誤差值小于或等于所述誤差閾值,得到訓練完成的所述深度學習問答模型。
5.如權利要求1至4中任意一項所述的基于命名實體的文本問答方法,其特征在于,所述對所述問答語料集執行命名實體識別及命名實體劃分,得到多個問答語料子集,包括:
對所述問答語料集執行命名實體識別得到問答實體集;
根據所述問答實體集所包括的問答實體,對所述問答語料集進行文本劃分得到多個所述問答語料子集。
6.一種基于命名實體的文本問答裝置,其特征在于,所述裝置包括:
實體文本計算模塊,用于接收用戶輸入的咨詢文本,對所述咨詢文本執行命名實體識別,得到實體文本集;
問答語料計算模塊,用于獲取問答語料集,并對所述問答語料集執行命名實體識別及命名實體劃分,得到多個問答語料子集;
編碼模塊,用于從多個所述問答語料子集中提取與所述咨詢文本相關的問答語料子集,組成回答文本集,并將所述回答文本集進行切分及編碼操作,得到問答編碼集;
回答文本計算模塊,用于將所述問答編碼集輸入至預訓練完成的深度學習問答模型中,得到所述咨詢文本的回答文本。
7.如權利要求6所述的基于命名實體的文本問答裝置,其特征在于,所述裝置還包括模型訓練模塊,用于:
根據預先設定的網絡組合權重函數,對多組長短期記憶網絡進行組合得到待訓練深度學習問答模型,并獲取問答訓練集和問答標簽集,將所述問答訓練集輸入至所述待訓練深度學習問答模型;
計算每組長短期記憶網絡之間的關聯權重得到關聯權重集;
對所述關聯權重集的進行加權求和及激活處理得到問答預測集;
計算所述問答預測集和所述問答標簽集的誤差值;在所述誤差值小于或等于預設的誤差閾值時,得到訓練完成的深度學習問答模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010434262.4/1.html,轉載請聲明來源鉆瓜專利網。





