[發明專利]問答文本的語義匹配方法、裝置、介質及電子設備有效
申請號: | 201810588271.1 | 申請日: | 2018-06-08 |
公開(公告)號: | CN108846077B | 公開(公告)日: | 2022-01-11 |
發明(設計)人: | 李淵;劉設偉 | 申請(專利權)人: | 泰康保險集團股份有限公司;泰康在線財產保險股份有限公司 |
主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F40/30 |
代理公司: | 隆天知識產權代理有限公司 72003 | 代理人: | 李昕巍;章侃銥 |
地址: | 100031 北*** | 國省代碼: | 北京;11 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 問答 文本 語義 匹配 方法 裝置 介質 電子設備 | ||
本公開提供了一種問答文本的語義匹配方法,包括利用循環神經網絡獲取問題文本的具有上下文局部特征的特征向量序列和候選答案文本的具有上下文局部特征的特征向量序列;基于問題文本和所述候選答案文本的具有上下文局部特征的特征向量序列和所述問題文本和候選答案的具有上下文局部特征的特征向量序列中每個特征向量的注意力權重,生成問題文本的具有上下文局部特征和全局特征的特征向量序列和候選答案文本的具有上下文局部特征和全局特征的特征向量序列;根據問題文本的具有上下文局部特征和全局特征的特征向量序列、候選答案文本的具有上下文局部特征和全局特征的特征向量序列,確定問題文本與候選答案的語義匹配度。
技術領域
本發明涉及自然語言處理技術領域,具體而言,涉及一種問答文本的語義匹配方法、裝置、介質及電子設備。
背景技術
目前,基于深度學習的問答文本語義匹配的方法可以包含以下步驟:基于神經網絡訓練的詞嵌入模型對文本進行詞向量表示,其表示語義能力更強。通過構建長短時記憶網絡LSTM(Long Short-Term Memory)或門控循環單元GRU(Gated Recurrent Unit)等深度學習等模型對文本建模。雖然這些方法對特征選取依賴性較低,一定程度上提取了文本淺層語義信息和上下文局部特征,但不能表示大量重點全局特征,因此降低了問答文本語義匹配的準確性。
需要說明的是,在上述背景技術部分公開的信息僅用于加強對本發明的背景的理解,因此可以包括不構成對本領域普通技術人員已知的現有技術的信息。
發明內容
本發明實施例的目的在于提供一種問答文本的語義匹配方法、裝置、介質及電子設備,進而至少可以在一定程度上克服問答文本語義匹配的準確性較低的問題。
本發明的其他特性和優點將通過下面的詳細描述變得顯然,或部分地通過本發明的實踐而習得。
根據本發明實施例的第一方面,提供了一種問答文本的語義匹配方法,包括:利用循環神經網絡獲取問題文本的具有上下文局部特征的特征向量序列和候選答案文本的具有上下文局部特征的特征向量序列;基于所述問題文本的具有上下文局部特征的特征向量序列和所述問題文本的具有上下文局部特征的特征向量序列中每個特征向量的注意力權重,生成所述問題文本的具有上下文局部特征和全局特征的特征向量序列;基于所述候選答案文本的具有上下文局部特征的特征向量序列和所述候選答案文本的具有上下文局部特征的特征向量序列中每個特征向量的注意力權重,生成所述候選答案文本的具有上下文局部特征和全局特征的特征向量序列;根據所述問題文本的具有上下文局部特征和全局特征的特征向量序列、所述候選答案文本的具有上下文局部特征和全局特征的特征向量序列,確定所述問題文本與所述候選答案文本的語義匹配度。
在本發明的一些實施例中,基于前述方案,所述循環神經網絡包括雙向循環神經網絡,所述雙向循環神經網絡中的循環神經網絡包括基于長短時記憶LSTM和/或基于門控循環單元GRU的網絡。
在本發明的一些實施例中,基于前述方案,上述還包括:基于所述問題文本的具有上下文局部特征的特征向量序列和所述候選答案文本的具有上下文局部特征的特征向量序列,生成背景信息,所述背景信息包括所述問題文本的詞向量和所述候選答案的詞向量在循環神經網絡最后時刻之前的所有時間狀態的語義信息;根據所述背景信息,確定所述問題文本的具有上下文局部特征的特征向量序列中每個時刻特征向量的注意力權重和所述候選答案文本的具有上下文局部特征的特征向量序列中每個時刻特征向量的注意力權重。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于泰康保險集團股份有限公司;泰康在線財產保險股份有限公司,未經泰康保險集團股份有限公司;泰康在線財產保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810588271.1/2.html,轉載請聲明來源鉆瓜專利網。