[發明專利]文本蘊含識別方法及裝置有效
| 申請號: | 201811014746.2 | 申請日: | 2018-08-31 |
| 公開(公告)號: | CN109165300B | 公開(公告)日: | 2020-08-11 |
| 發明(設計)人: | 杜倩龍;宗成慶;蘇克毅 | 申請(專利權)人: | 中國科學院自動化研究所 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/30;G06F40/279 |
| 代理公司: | 北京市恒有知識產權代理事務所(普通合伙) 11576 | 代理人: | 郭文浩 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 蘊含 識別 方法 裝置 | ||
1.一種文本蘊含識別方法,其特征在于包括:
獲取待識別文本蘊含句對中源句子的詞匯向量集合和目標句子的詞匯向量集合;
利用預設的第一感知器并且根據所述源句子的詞匯向量集合與目標句子的詞匯向量集合,分別獲取所述源句子中每個詞與所述目標句子之間的第一比較向量以及所述目標句子中每個詞與所述源句子之間的第二比較向量;
根據所述源句子的詞匯向量集合與目標句子的詞匯向量集合,獲取所述源句子的每個詞分別與所述目標句子的每個詞之間的對齊權重;根據所述對齊權重對所述目標句子中每個詞的詞匯向量進行加權求和,得到所述源句子中每個詞對應的第一相關語義向量,根據所述對齊權重對所述源句子中每個詞的詞匯向量進行加權求和,得到所述目標句子中每個詞對應的第二相關語義向量;
利用所述第一感知器并且根據每個所述第一相關語義向量獲取所述源句子中每個詞與所述目標句子之間的第一比較向量,以及根據每個所述第二相關語義向量獲取所述目標句子中每個詞與所述源句子之間的第二比較向量;
利用所述第一感知器并且根據每個所述第一相關語義向量獲取所述源句子中每個詞與所述目標句子之間的第一比較向量的步驟包括:
按照如下公式所示的方法獲取所述源句子中每個詞與所述目標句子之間的第一比較向量:
根據每個所述第二相關語義向量獲取所述目標句子中每個詞與所述源句子之間的第二比較向量的步驟包括:
按照如下公式所示的方法獲取所述目標句子中每個詞與所述源句子之間的第二比較向量:
其中,表示所述源句子的詞匯向量集合中第i個詞匯與所述目標句子的詞匯向量集合的比較結果,即第一比較向量,表示所述目標句子的詞匯向量集合中第j個詞匯與所述源句子的詞匯向量集合的比較結果,即第二比較向量,“;”表示拼接操作,“-”和“⊙”分別表示減操作和點乘操作,G表示所述第一感知器,第一感知器是一個一層的多層感知機,其激勵函數是Relu;
基于預設的語義關系推理模型并且根據所述第一比較向量與第二比較向量,分別獲取所述源句子中每個詞與所述目標句子之間的第一推理向量以及所述目標句子中每個詞與所述源句子之間的第二推理向量;
利用預設的第二感知器分別獲取每個所述第一推理向量和每個所述第二推理向量的門結構權重;
利用預設的第二感知器獲取每個所述第一推理向量的門結構權重的步驟包括:
按照下式所示的方法獲取每個所述第一推理向量的門結構權重:
利用預設的第二感知器獲取每個所述第二推理向量的門結構權重的步驟包括:
按照下式所示的方法獲取每個所述第二推理向量的門結構權重:
其中,表示所述源句子的詞匯向量集合中第i個詞匯與所述目標句子的詞匯向量集合的門結構權重,表示所述目標句子的詞匯向量集合中第j個詞匯與所述源句子的詞匯向量集合的門結構權重,R表示所述第二感知器,第二感知器是一個一層的多層感知機,第二感知器的激勵函數是Sigmoid函數;
根據所述源句子中每個詞對應的第一推理向量及其門結構權重進行加權融合得到所述源句子的第三推理向量,根據所述目標句子中每個詞對應的第二推理向量及其門結構權重進行加權融合得到所述目標句子的第四推理向量;
根據所述源句子的第三推理向量和所述目標句子的第四推理向量預測所述源句子和目標句子之間的語義蘊含關系;
其中,所述語義關系推理模型是基于預設的語料集并利用機器學習算法所構建的雙向遞歸神經網絡模型。
2.根據權利要求1所述的文本蘊含識別方法,其特征在于,“獲取所述源句子的每個詞分別與所述目標句子的每個詞之間的對齊權重”的步驟包括:
按照如下公式所示的方法獲取所述對齊權重:
其中,ei,j表示所述源句子的詞匯向量集合中第i個詞匯與所述目標句子的詞匯向量集合中第j個詞匯的對齊權重,分別表示所述源句子的詞匯向量集合中第i個詞匯向量和所述目標句子的詞匯向量集合中第j個詞匯向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811014746.2/1.html,轉載請聲明來源鉆瓜專利網。





