[發明專利]一種命名實體識別方法、裝置、設備及存儲介質有效
| 申請號: | 202110795179.4 | 申請日: | 2021-07-14 |
| 公開(公告)號: | CN113420561B | 公開(公告)日: | 2022-12-13 |
| 發明(設計)人: | 鐘韻辭;萬建偉;孫科;賀凱;余非;裴衛民;馮文亮 | 申請(專利權)人: | 上海浦東發展銀行股份有限公司 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06F40/126;G06F40/216;G06F16/35;G06N3/04 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 趙翠香 |
| 地址: | 200000 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 命名 實體 識別 方法 裝置 設備 存儲 介質 | ||
1.一種命名實體識別方法,其特征在于,包括:
獲取待識別字符的圖特征向量;
將所述待識別字符的圖特征向量輸入目標命名實體識別模型,得到所述待識別字符的圖特征向量對應的實體類別;
在獲取待識別字符的圖特征向量之前,還包括:
獲取文本樣本,其中,所述文本樣本包括:實體標注;
根據所述文本樣本中的字符和字符之間的關系建立字符實體圖;
根據所述字符實體圖確定每個字符節點對應的鄰接向量;
將每個字符節點對應的鄰接向量輸入SDNE模型,得到每個字符節點對應的圖特征向量;
所述SDNE模型的損失函數包括:
其中,|V|為字符實體圖中字符節點的數量,W代表SDNE模型的網絡參數,xi為字符節點i對應的鄰接向量,x′i為SDNE模型的輸出,ui為字符i的圖特征向量,uj為字符j的圖特征向量,sij是鄰接矩陣上ij位置對應的邊權重,bi是字符i對應的編解碼損失權重向量,n+為正邊權重的數量,n-為負邊權重的數量,n0為權重為0的邊的數量。
2.根據權利要求1所述的方法,其特征在于,獲取待識別字符的圖特征向量,包括:
獲取待識別字符;
根據所述待識別字符查詢所述每個字符節點對應的圖特征向量,得到所述待識別字符的圖特征向量。
3.根據權利要求1所述的方法,其特征在于,根據所述文本樣本中的字符和字符之間的關系建立字符實體圖,包括:
將所述文本樣本中的每一個字符確定為字符節點,根據字符之間的關系建立字符節點之間的邊,得到字符實體圖。
4.根據權利要求1所述的方法,其特征在于,在根據所述文本樣本中的字符和字符之間的關系建立字符實體圖之后,還包括:
按照預設規則確定所述字符實體圖的邊的權重。
5.根據權利要求4所述的方法,其特征在于,按照預設規則確定所述字符實體圖的邊的權重:
根據各個實體占總實體數的比例確定各個實體對應的邊的權重。
6.一種命名實體識別裝置,其特征在于,包括:
獲取模塊,用于獲取待識別字符的圖特征向量;
識別模塊,用于將所述待識別字符的圖特征向量輸入目標命名實體識別模型,得到所述待識別字符的圖特征向量對應的實體類別;
在獲取待識別字符的圖特征向量之前,還包括:
獲取文本樣本,其中,所述文本樣本包括:實體標注;
根據所述文本樣本中的字符和字符之間的關系建立字符實體圖;
根據所述字符實體圖確定每個字符節點對應的鄰接向量;
將每個字符節點對應的鄰接向量輸入SDNE模型,得到每個字符節點對應的圖特征向量;
所述SDNE模型的損失函數包括:
其中,|V|為字符實體圖中字符節點的數量,W代表SDNE模型的網絡參數,xi為字符節點i對應的鄰接向量,x′i為SDNE模型的輸出,ui為字符i的圖特征向量,uj為字符j的圖特征向量,sij是鄰接矩陣上ij位置對應的邊權重,bi是字符i對應的編解碼損失權重向量,n+為正邊權重的數量,n-為負邊權重的數量,n0為權重為0的邊的數量。
7.一種電子設備,其特征在于,包括:
一個或多個處理器;
存儲器,用于存儲一個或多個程序;
當所述一個或多個程序被所述一個或多個處理器執行時,使得所述處理器實現如權利要求1-5中任一所述的方法。
8.一種包含計算機程序的計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被一個或多個處理器執行時實現如權利要求1-5中任一所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海浦東發展銀行股份有限公司,未經上海浦東發展銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110795179.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種球面、圓柱面滾子全自動渦流檢測設備
- 下一篇:一種耐火容器的修補方法





