[發(fā)明專利]信息識別方法、裝置、電子設備及存儲介質在審
| 申請?zhí)枺?/td> | 202111607237.2 | 申請日: | 2021-12-24 |
| 公開(公告)號: | CN114254644A | 公開(公告)日: | 2022-03-29 |
| 發(fā)明(設計)人: | 劉東陽;張陽 | 申請(專利權)人: | 建信金融科技有限責任公司 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06F16/35;G06N3/08 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 呂朝蕙 |
| 地址: | 200120 上海市浦東新區(qū)中國(*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息 識別 方法 裝置 電子設備 存儲 介質 | ||
本公開提供了一種信息識別方法、裝置、電子設備、存儲介質及計算機程序產品,涉及人工智能技術領域,可應用于金融領域或其他領域。該信息識別方法包括:對文本進行特征提取,得到包含第一事件主體和第一事件主體類別的第一特征向量;使用預訓練模型對文本進行特征提取,得到包含第二事件主體和第二事件主體類別的第二特征向量;利用全連接神經網絡依據第一特征向量和第二特征向量得到針對文本的第一命名實體識別結果。
技術領域
本公開涉及人工智能技術領域,更具體地,涉及一種信息識別方法、裝置、電子設備、存儲介質和計算機程序產品。
背景技術
隨著互聯網的發(fā)展,每天會產生海量文本信息,但是在面對海量的文本信息時,如何快速、準確地獲取用戶關注的信息成為一大難題。
傳統技術中通常基于深度學習的方法來對實現命名實體識別,但基于深度學習方法進行命名實體識別的過程中,通常需要以訓練好的詞向量或者隨機初始化的字向量作為輸入,不僅識別效果差,而且識別效率低下,甚至在一些復雜的語境下,導致識別失敗。
發(fā)明內容
鑒于上述問題,本公開提供了一種信息識別方法、裝置、電子設備、存儲介質和計算機程序產品。
根據本公開的第一個方面,提供了一種信息識別方法,包括:
對文本進行特征提取,得到包含第一事件主體和第一事件主體類別的第一特征向量;
使用預訓練模型對文本進行特征提取,得到包含第二事件主體和第二事件主體類別的第二特征向量;
利用全連接神經網絡依據第一特征向量和第二特征向量得到針對文本的第一命名實體識別結果。
根據本公開的實施例,其中,使用預訓練模型對文本進行特征提取,得到包含第二事件主體和第二事件主體類別的第二特征向量,包括:
將文本劃分為訓練數據和驗證數據;
使用預訓練模型對訓練數據和驗證數據進行特征提取,得到包含第二事件主體和第二事件主體類別的第二特征向量。
根據本公開的實施例,其中,預訓練模型包括第一預訓練模型和第二預訓練模型,所述方法還包括:
獲取使用第一預訓練模型得到的第一命名實體識別結果;
獲取使用第二預訓練模型得到的第二命名實體識別結果;
將使用第一預訓練模型得到的第一命名實體識別結果與使用第二預訓練模型得到的第二命名實體識別結果進行融合,得到針對文本的第三命名實體識別結果。
根據本公開的實施例,其中,利用全連接神經網絡依據第一特征向量和第二特征向量得到針對文本的命名實體識別結果,包括:
對第一特征向量和第二特征向量進行加和,得到加和后的特征向量;
利用全連接神經網絡對加和后的特征向量進行分類,得到針對文本的第一命名實體識別結果。
根據本公開的實施例,其中,對文本進行特征提取,得到包含第一事件主體和第一事件主體類別的第一特征向量,包括:
對文本進行標注,以提取第一事件主體和第一事件主體類別;
將第一事件主體和第一事件主體類別表示為包含第一事件主體和第一事件主體類別的第一特征向量。
根據本公開的實施例,其中,至少基于以下方法對文本進行標注:BIOES標注法或BIO標注法。
根據本公開的實施例,其中,將使用第一預訓練模型得到的第一命名實體識別結果與使用第二預訓練模型得到的第二命名實體識別結果進行融合,得到針對文本的第三命名實體識別結果,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于建信金融科技有限責任公司,未經建信金融科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111607237.2/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





