[發明專利]基于人工智能的問答文本匹配方法、裝置、介質及電子設備在審
| 申請號: | 202010046066.X | 申請日: | 2020-01-16 |
| 公開(公告)號: | CN111259647A | 公開(公告)日: | 2020-06-09 |
| 發明(設計)人: | 李淵;劉設偉 | 申請(專利權)人: | 泰康保險集團股份有限公司;泰康在線財產保險股份有限公司 |
| 主分類號: | G06F40/194 | 分類號: | G06F40/194;G06F40/284;G06F40/30;G06F40/247;G06N3/08 |
| 代理公司: | 隆天知識產權代理有限公司 72003 | 代理人: | 章侃銥;鄭特強 |
| 地址: | 100031 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 問答 文本 匹配 方法 裝置 介質 電子設備 | ||
1.一種基于人工智能的問答文本匹配方法,其特征在于,包括:
基于當前用戶的問題文本檢索出候選問題文本的集合;
對所述當前用戶的問題文本和所述候選問題文本的集合中每個候選問題文本分別進行分布式表示,得到所述當前用戶的問題文本的詞向量序列和所述候選問題文本的集合中每個候選問題文本的詞向量序列;
通過深度學習模型確定所述當前用戶的問題文本的詞向量序列和所述候選問題文本的集合中每個候選問題文本的詞向量序列的語義相似度;
通過預設公式確定所述當前用戶的問題文本與所述候選問題文本的集合中每個候選問題文本的文本相似度;
根據所述語義相似度和所述文本相似度確定所述當前用戶的問題文本與所述候選問題文本的集合中每個候選問題文本的綜合相似度;
根據所述當前用戶的問題文本與所述候選問題文本的集合中每個候選問題文本的綜合相似度確定與所述當前用戶的問題文本匹配的候選答案文本。
2.根據權利要求1所述的方法,其特征在于,所述深度學習模型是基于預設領域的問題文本通過遷移學習對預訓練模型進行調整得到的。
3.根據權利要求2所述的方法,其特征在于,在基于當前用戶的問題文本檢索出候選問題文本的集合之前,該方法還包括:
獲取通用領域的問題文本,所述通用領域的問題文本中不包含所述預設領域的問題文本;
對所述通用領域的問題文本中的每個問題本進行分布式表示,得到所述通用領域的問題文本中的每個問題文本的詞向量序列;
通過循環神經網絡對每個問題文本的詞向量序列進行預訓練,得到所述預訓練模型。
4.根據權利要求3所述的方法,其特征在于,在得到所述預訓練模型之后,該方法還包括:
獲取所述預設領域的問題文本;
對所述預設領域的問題文本中的每個問題本進行分布式表示,得到所述預設領域的問題文本中的每個問題文本的詞向量序列;
基于所述預設領域的問題文本中的每個問題文本的詞向量序列通過所述遷移學習對預訓練模型進行調整,得到所述深度學習模型。
5.根據權利要求1所述的方法,其特征在于,通過深度學習模型確定所述當前用戶的問題文本的詞向量序列和所述候選問題文本的集合中每個候選問題文本的詞向量序列的語義相似度包括:
通過循環神經網絡從所述當前用戶的問題文本的詞向量序列提取所述當前用戶的問題文本的上下文語義特征序列,以及從所述候選問題文本的集合中每個候選問題文本的詞向量序列提取所述候選問題文本的集合中每個候選問題文本的上下文語義特征序列;
計算所述當前用戶的問題文本的上下文語義特征序列與所述候選問題文本的集合中每個候選問題文本的上下文語義特征序列的語義相似度。
6.根據權利要求1所述的方法,其特征在于,在通過預設公式確定所述當前用戶的問題文本與所述候選問題文本的集合中每個候選問題文本的文本相似度之前,該方法還包括:
對所述當前用戶的問題文本和所述候選問題文本的集合中每個候選問題文本分別進行分詞處理,得到所述當前用戶的問題文本的詞集和所述候選問題文本的集合中每個候選問題文本的詞集。
7.根據權利要求6所述的方法,其特征在于,通過預設公式確定所述當前用戶的問題文本與所述候選問題文本的集合中每個候選問題文本的文本相似度包括:
對所述當前用戶的問題文本的詞集與所述候選問題文本的集合中每個候選問題文本的詞集分別進行同義詞關聯;
基于同義詞關聯后的結果通過預設公式計算所述當前用戶的問題文本與所述候選問題文本的集合中每個候選問題文本的文本相似度;
其中所述預設公式為:
其中,A為同義詞關聯后的所述當前用戶的問題文本的詞集;B為同義詞關聯后的所述候選問題文本的集合中每個候選問題文本的詞集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于泰康保險集團股份有限公司;泰康在線財產保險股份有限公司,未經泰康保險集團股份有限公司;泰康在線財產保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010046066.X/1.html,轉載請聲明來源鉆瓜專利網。





