[發明專利]事件主體識別模型優化方法、裝置、設備及可讀存儲介質有效
| 申請號: | 202010911064.2 | 申請日: | 2020-09-02 |
| 公開(公告)號: | CN112036168B | 公開(公告)日: | 2023-04-25 |
| 發明(設計)人: | 李超;吳海山;殷磊 | 申請(專利權)人: | 深圳前海微眾銀行股份有限公司 |
| 主分類號: | G06F40/279 | 分類號: | G06F40/279;G06F16/35;G06F40/126;G06F40/151;G06F40/216;G06F40/284;G06F40/30 |
| 代理公司: | 深圳市世紀恒程知識產權代理事務所 44287 | 代理人: | 張志江 |
| 地址: | 518000 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 事件 主體 識別 模型 優化 方法 裝置 設備 可讀 存儲 介質 | ||
1.一種事件主體識別模型優化方法,其特征在于,待優化的事件主體識別模型包括信息提取模塊、主體識別模塊、事件與主體匹配模塊和事件分類模塊,所述方法包括以下步驟:
將各類事件對應的訓練文本輸入所述信息提取模塊,提取得到所述訓練文本中的字符信息和所述訓練文本與各類事件相關的事件信息;
將所述字符信息和所述訓練文本對應的主體標注輸入所述主體識別模塊進行識別,得到主體識別結果和主體識別損失;
將所述事件信息和所述主體識別結果輸入所述事件與主體匹配模塊進行匹配得到匹配結果,并基于所述匹配結果和所述訓練文本對應的事件主體匹配標注計算匹配損失,其中,所述訓練文本的事件主體匹配標注包括每一類事件分別與所述訓練文本中每一個字符之間的匹配標注,所述匹配標注表示所述訓練文本是否屬于該類事件以及該字符是否屬于事件主體;
將所述事件信息輸入所述事件分類模塊進行分類得到事件分類結果,并基于所述事件分類結果和所述訓練文本對應的事件類型標注計算分類損失;
優化所述主體識別損失、所述匹配損失和所述分類損失以優化所述事件主體識別模型。
2.如權利要求1所述的事件主體識別模型優化方法,其特征在于,所述事件信息包括各類事件分別對應的事件信息,所述主體識別結果包括所述訓練文本中預測事件主體對應的字符信息,
所述將所述事件信息和所述主體識別結果輸入所述事件與主體匹配模塊進行匹配得到匹配結果的步驟包括:
將所述事件信息和所述字符信息輸入所述事件與主體匹配模塊,以調用所述事件與主體匹配模塊基于所述事件信息和所述字符信息計算各類事件分別與所述預測事件主體之間的匹配概率,并將各所述匹配概率作為所述匹配結果。
3.如權利要求1所述的事件主體識別模型優化方法,其特征在于,所述信息提取模塊包括字符信息提取模塊和事件信息提取模塊,
所述將各類事件對應的訓練文本輸入所述信息提取模塊,提取得到所述訓練文本中的字符信息和所述訓練文本與各類事件相關的事件信息的步驟包括:
將所述訓練文本輸入所述字符信息提取模塊,提取得到所述訓練文本中的字符信息;
將所述訓練文本和所述字符信息輸入所述事件信息提取模塊,提取得到所述訓練文本與各類事件相關的事件信息。
4.如權利要求3所述的事件主體識別模型優化方法,其特征在于,所述字符信息提取模塊包括第一語義理解編碼器和第一事件編碼信息,
所述將所述訓練文本輸入所述字符信息提取模塊,提取得到所述訓練文本中的字符信息的步驟包括:
將所述訓練文本輸入所述第一語義理解編碼器中進行編碼,得到所述訓練文本中各字符對應的字符編碼信息;
對所述字符編碼信息和所述第一事件編碼信息進行關聯運算,得到所述訓練文本中各個字符與各類事件之間的字符事件關聯信息,將所述字符事件關聯信息作為所述字符信息。
5.如權利要求4所述的事件主體識別模型優化方法,其特征在于,所述第一事件編碼信息包括各類事件對應的編碼信息,
所述優化所述主體識別損失、所述匹配損失和所述分類損失以優化所述事件主體識別模型的步驟之前,還包括:
基于所述第一事件編碼信息計算各類事件兩兩之間編碼信息的相似度,并將各相似度相加得到事件編碼懲罰值;
所述優化所述主體識別損失、所述匹配損失和所述分類損失以優化所述事件主體識別模型的步驟包括:
優化所述事件編碼懲罰值、所述主體識別損失、所述匹配損失和所述分類損失以優化所述事件主體識別模型。
6.如權利要求3所述的事件主體識別模型優化方法,其特征在于,所述事件信息提取模塊包括第二語義理解編碼器和第二事件編碼信息,
所述將所述訓練文本和所述字符信息輸入所述事件信息提取模塊,提取得到所述訓練文本與各類事件相關的事件信息的步驟包括:
將所述訓練文本輸入所述第二語義理解編碼器進行編碼,得到所述訓練文本對應的文本編碼信息;
對所述文本編碼信息和所述第二事件編碼信息進行關聯運算,得到所述訓練文本與各類事件之間的文本事件關聯信息;
將所述字符信息和所述文本事件關聯信息進行組合,得到所述事件信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳前海微眾銀行股份有限公司,未經深圳前海微眾銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010911064.2/1.html,轉載請聲明來源鉆瓜專利網。





