[發明專利]用于事件檢測的網絡訓練方法及裝置在審
| 申請號: | 202011111486.8 | 申請日: | 2020-10-16 |
| 公開(公告)號: | CN112199950A | 公開(公告)日: | 2021-01-08 |
| 發明(設計)人: | 徐軍;黃偉鵬;徐學可;王峰 | 申請(專利權)人: | 支付寶(杭州)信息技術有限公司 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06F40/216;G06F16/35;G06N3/04;G06N3/08 |
| 代理公司: | 北京億騰知識產權代理事務所(普通合伙) 11309 | 代理人: | 陳霽;周良玉 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 事件 檢測 網絡 訓練 方法 裝置 | ||
本說明書實施例提供了一種用于事件檢測的網絡訓練方法及裝置。其中包括動態感知網絡和目標反饋網絡。動態感知網絡包含順序排列的多個備選的計算層,在對動態感知網絡進行訓練時,針對獲取的樣本文本中的任意一個詞,從動態感知網絡中逐漸增加地選擇前若干個計算層,并通過前若干個計算層和該詞的初始特征向量確定該詞的中間特征向量,基于第一分類器和該詞的中間特征向量確定第一預測標簽,當第一預測標簽與對應的標注標簽的第一差異小于第一預設閾值時,將前若干個計算層作為與該詞對應的計算層,將該詞的中間特征向量作為該詞的第一特征向量,基于第一差異確定第一預測損失,向減小第一預測損失的方向,調整與該詞對應的計算層中的模型參數。
技術領域
本說明書一個或多個實施例涉及機器學習技術領域,尤其涉及用于事件檢測的網絡訓練方法及裝置。
背景技術
在各種新聞、消息爆量增長的環境下,從中檢測出人們關心的各種事件,以便提供給需要者,使其及時充分地做出應對,是當前的一個重要研究方向。處理平臺可以預先定義各種事件類型對應的事件觸發詞等,并為各種事件類型設置標簽,通過對待檢測文本中包含的詞所歸屬的標簽進行預測,進而從待檢測文本中檢測各種事件類型。例如,對于定義的“高層離職”事件類型,其對應的事件觸發詞可以包括高層離職、高層退休、管理層離職等等。從文本中檢測其包含的事件類型,與對文本以及文本中詞的語義理解密切相關。
因此,希望能有改進的方案,在對待檢測文本進行事件檢測時,可以更加準確地檢測出其包含的事件類型。
發明內容
本說明書一個或多個實施例描述了用于事件檢測的網絡訓練方法及裝置,以提高事件檢測的準確性。具體的技術方案如下。
第一方面,實施例提供了一種用于進行事件檢測的動態感知網絡訓練方法,所述動態感知網絡包含順序排列的多個備選的計算層;所述方法通過處理平臺執行,包括:
獲取包含多個詞的樣本文本、多個詞分別對應的初始特征向量和標注標簽,所述標注標簽包括與事件類型相關的第一類標簽和與事件類型無關的第二類標簽;
針對所述樣本文本中的任意一個詞,從所述動態感知網絡中逐漸增加地選擇前若干個計算層,并通過所述前若干個計算層和該詞的初始特征向量確定該詞的中間特征向量,基于第一分類器和該詞的中間特征向量確定第一預測標簽,當所述第一預測標簽與對應的標注標簽的第一差異小于第一預設閾值時,將所述前若干個計算層作為與該詞對應的計算層,將該詞的所述中間特征向量作為所述動態感知網絡輸出的該詞的第一特征向量;預測標簽是該詞在所述第一類標簽或所述第二類標簽中歸屬的標簽;
基于所述第一差異確定第一預測損失,向減小所述第一預測損失的方向,調整與該詞對應的計算層中的模型參數。
在一種實施方式中,通過所述前若干個計算層和該詞的初始特征向量確定該詞的中間特征向量,包括:
通過所述前若干個計算層,基于該詞的初始特征向量和所述樣本文本中該詞之前的詞信息,確定該詞的中間特征向量。
在一種實施方式中,確定該詞的中間特征向量,包括:
將該詞的初始特征向量和該詞之前的詞信息輸入所述前若干個計算層中的第一個計算層,并至少將每個計算層的計算結果輸入下一個計算層,將所述前若干個計算層中的最后一個計算層的計算結果,作為該詞的中間特征向量。
在一種實施方式中,該方法還包括,將該詞的初始特征向量輸入所述下一個計算層。
在一種實施方式中,所述該詞之前的詞信息,基于該詞之前的詞的第一特征向量確定。
在一種實施方式中,基于第一分類器和該詞的中間特征向量確定第一預測標簽,包括:
基于該詞的中間特征向量確定該詞的特征概率,所述特征概率表示該中間特征向量作為第一特征向量的概率;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于支付寶(杭州)信息技術有限公司,未經支付寶(杭州)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011111486.8/2.html,轉載請聲明來源鉆瓜專利網。





