[發明專利]問答文本的語義匹配方法、裝置、介質及電子設備在審
| 申請號: | 201811563115.6 | 申請日: | 2018-12-20 |
| 公開(公告)號: | CN109726396A | 公開(公告)日: | 2019-05-07 |
| 發明(設計)人: | 李淵;賀國秀 | 申請(專利權)人: | 泰康保險集團股份有限公司;泰康在線財產保險股份有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F16/332;G06N3/04;G06N3/08 |
| 代理公司: | 隆天知識產權代理有限公司 72003 | 代理人: | 章侃銥;李玉鎖 |
| 地址: | 100031 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 特征信息 文本語義 語義匹配 句法結構 全局特征 單詞 匹配 循環神經網絡 注意力機制 電子設備 局部特征 局部語義 句法特征 句法信息 匹配技術 單一化 有效地 抽取 學習 | ||
1.一種問答文本的語義匹配方法,其特征在于,該方法包括:
利用循環神經網絡獲取問題文本的具有上下文局部特征和句法結構特征的多級特征向量序列,以及獲取候選答案文本的具有上下文局部特征和句法結構特征的多級特征向量序列;
基于所述問題文本的具有上下文局部特征和句法結構特征的多級特征向量序列和所述問題文本的具有上下文局部特征和句法結構特征的多級特征向量序列中每個特征向量的注意力權重,生成所述問題文本的具有上下文局部特征、句法結構特征的和全局特征的特征向量,以及基于所述候選答案文本的具有上下文局部特征和句法結構特征的多級特征向量序列和所述候選答案文本的具有上下文局部特征和句法結構特征的多級特征向量序列中每個特征向量的注意力權重,生成所述候選答案文本的具有上下文局部特征、句法結構特征和全局特征的特征向量;
根據所述問題文本的具有上下文局部特征、句法結構特征的和全局特征的特征向量和所述候選答案文本的具有上下文局部特征、句法結構特征的和全局特征的特征向量,確定所述問題文本與所述候選答案文本的語義匹配度。
2.根據權利要求1所述的方法,其特征在于,在利用循環神經網絡獲取問題文本的具有上下文局部特征和句法結構特征的多級特征向量序列,以及獲取候選答案文本的具有上下文局部特征和句法結構特征的多級特征向量序列之前,該方法還包括:
根據知識庫問答文本語料構建專業問答詞典;
根據所述專業問答詞典對所述問題文本和所述候選答案文本進行分析,得到所述問題文本的單詞、所述問題文本的句法結構和所述候選答案文本的單詞、所述候選答案文本的句法結構;
對所述問題文本的單詞、所述問題文本的句法結構和所述候選答案文本的單詞、所述候選答案文本的句法結構分別進行分布式表示,得到問題文本的詞向量和句法結構向量組成的向量序列和候選答案文本的詞向量和句法結構向量組成的向量序列。
3.根據權利要求1所述的方法,其特征在于,所述循環神經網絡包括雙向循環神經網絡,所述雙向循環神經網絡中的循環神經網絡包括基于長短時記憶LSTM和/或基于門控循環單元GRU的網絡。
4.根據權利要求1所述的方法,其特征在于,該方法還包括:
基于所述問題文本的具有上下文局部特征和句法結構特征的多級特征向量序列和所述候選答案文本的具有上下文局部特征和句法結構特征的多級特征向量序列,生成背景信息,所述背景信息包括所述問題文本的詞向量和所述候選答案的詞向量在循環神經網絡最后時刻之前的所有時間狀態的語義信息和句法結構信息;
根據所述背景信息,確定所述問題文本的具有上下文局部特征和句法結構特征的多級特征向量序列中每個時刻特征向量的注意力權重和所述候選答案文本的具有上下文局部特征和句法結構特征的多級特征向量序列中每個時刻特征向量的注意力權重。
5.根據權利要求4所述的方法,其特征在于,基于所述問題文本的具有上下文局部特征和句法結構特征的多級特征向量序列和所述問題文本的具有上下文局部特征和句法結構特征的多級特征向量序列中每個特征向量的注意力權重,生成所述問題文本的具有上下文局部特征、句法結構特征和全局特征的特征向量包括:
根據所述背景信息,確定所述背景信息與所述問題文本的具有上下文局部特征和句法結構特征的多級特征向量序列中的每個時刻特征向量的相似度;
根據所述背景信息與所述問題文本的具有上下文局部特征和句法結構特征的多級特征向量序列中的每個時刻特征向量的相似度,確定所述問題文本的具有上下文局部特征的特征向量序列中的每個時刻特征向量的注意力權重;
根據所述問題文本的具有上下文局部特征和句法結構特征的多級特征向量序列中的每個時刻特征向量的注意力權重,對所述問題文本的具有上下文局部特征和句法結構特征的多級特征向量序列中的每個時刻特征向量加權并求和,得到所述問題文本的具有上下文局部特征、句法結構特征和全局特征的特征向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于泰康保險集團股份有限公司;泰康在線財產保險股份有限公司,未經泰康保險集團股份有限公司;泰康在線財產保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811563115.6/1.html,轉載請聲明來源鉆瓜專利網。





