[發明專利]一種命名實體識別方法及裝置在審
| 申請號: | 202011039983.1 | 申請日: | 2020-09-28 |
| 公開(公告)號: | CN112115721A | 公開(公告)日: | 2020-12-22 |
| 發明(設計)人: | 于騰;葛通;李曉雨;孫凱;徐文權;潘漢祺;胡永利;申彥明;陳維強;孫永良;于濤;王瑋 | 申請(專利權)人: | 青島海信網絡科技股份有限公司 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 杜晶 |
| 地址: | 266071 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 命名 實體 識別 方法 裝置 | ||
1.一種命名實體識別方法,其特征在于,所述方法包括:
將待識別文本的第一字序列矩陣輸入第一訓練模型獲取所述待識別文本的第一字特征矩陣;
將所述待識別文本的第一詞序列矩陣輸入第二訓練模型獲取所述待識別文本的第一詞特征矩陣;所述第一字特征矩陣的維度和所述第一詞特征矩陣的維度相同;
將所述第一字特征矩陣和所述第一詞特征矩陣進行處理,得到第一字詞融合特征矩陣;
通過第三訓練模型對所述第一字詞融合特征矩陣進行處理獲取所述待識別文本的命名實體識別結果。
2.如權利要求1所述的方法,其特征在于,將待識別文本的第一字序列矩陣輸入第一訓練模型獲取所述待識別文本的第一字特征矩陣之前,還包括:
設置所述第一訓練模型的第一參數,所述第一參數用于獲取預設維度的所述第一字特征矩陣;
將待識別文本的第一詞序列矩陣輸入第二訓練模型獲取所述待識別文本的第一詞特征矩陣之前,還包括:
設置所述第二訓練模型的第二參數,所述第二參數用于獲取所述預設維度的所述第一詞特征矩陣。
3.如權利要求1所述的方法,其特征在于,將待識別文本的第一詞序列矩陣輸入第二訓練模型獲取所述待識別文本的第一詞特征矩陣之前,還包括:
通過第一方式確定所述待識別文本的各字對應的第一字向量;所述各字的第一字向量組成所述第一字序列矩陣;
通過第二方式確定所述待識別文本的各字對應的第二字向量;所述第一方式與所述第二方式不同;
對所述待識別文本進行分詞,得到所述待識別文本的各分詞;
對每個分詞內各字的第二字向量進行同維度處理,確定各分詞的詞向量,從而得到所述第一詞序列矩陣。
4.如權利要求1所述的方法,其特征在于,所述第一訓練模型為BERT模型(變換器的雙向編碼器表征量模型,Bidirectional Encoder Representations from Transformers);所述第二訓練模型為CNN模型(卷積神經網絡,Convolutional Neural Networks)。
5.如權利要求1至4任一項所述的方法,其特征在于,所述第三訓練模型包括雙向長短期記憶網絡BiLSTM模型(Bi-directional Long Short-Term Memory,雙向長短期記憶網絡)和自注意力機制模型;
通過第三訓練模型對所述第一字詞融合特征矩陣進行處理獲取所述待識別文本的命名實體識別結果,包括:
通過所述BiLSTM模型對所述第一字詞融合特征矩陣進行處理,以增加所述第一字詞融合特征矩陣對應的所述待識別文本的語義信息,獲得第一字詞特征矩陣;
通過所述自注意力機制模型對所述第一字詞特征矩陣進行處理,以增加所述第一字詞特征矩陣中對應命名實體的權重,獲得第二字詞特征矩陣;
根據所述第二字特征矩陣獲取所述待識別文本的命名實體識別結果。
6.如權利要求5所述的方法,其特征在于,所述第三訓練模型還包括CRF模型(條件隨機場,conditional random field);
通過所述自注意力機制對所述第一字詞特征矩陣進行處理,以增加所述第一字詞特征矩陣中對應命名實體的權重,獲得第二字詞特征矩陣之后,還包括:
通過所述CRF模型對所述第二字詞特征矩陣進行序列優化,獲得第三字詞特征矩陣;
根據所述第三字特征矩陣獲取所述待識別文本的最優排列順序的命名實體識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于青島海信網絡科技股份有限公司,未經青島海信網絡科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011039983.1/1.html,轉載請聲明來源鉆瓜專利網。





