[發明專利]實體識別方法、裝置、電子設備及存儲介質在審
| 申請號: | 202110386195.8 | 申請日: | 2021-04-09 |
| 公開(公告)號: | CN112926333A | 公開(公告)日: | 2021-06-08 |
| 發明(設計)人: | 金曉輝;阮曉雯 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 熊永強 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 實體 識別 方法 裝置 電子設備 存儲 介質 | ||
本申請涉及一種實體識別方法、裝置、電子設備及存儲介質,其中方法包括:提取待識別的電子文檔中的正文;基于預設實體識別規則對所述正文進行識別,得到第一實體信息,基于預設實體識別模型對所述正文進行識別,得到第二實體信息;根據所述第一實體信息和所述第二實體信息確定所述電子文檔的目標實體信息。采用本申請,可提高識別實體的準確率,便于提高電子文檔的使用范圍。
技術領域
本申請涉及計算機技術領域,主要涉及了一種實體識別方法、裝置、電子設備及存儲介質。
背景技術
目前電子文檔已取代大多數紙質文檔,例如,電子病歷解決了紙質版病歷字跡不清,容易丟失損壞,很難共享患者信息等許多缺點,在各大醫院取得了廣泛的應用。但是,電子文檔并沒有完全結構化,從而導致難以直接基于電子文檔進行數據分析。
發明內容
本申請實施例提供了一種實體識別方法、裝置、電子設備及存儲介質,可提高識別實體的準確率,便于提高電子文檔的使用范圍。
第一方面,本申請實施例提供一種實體識別方法,其中:
提取待識別的電子文檔中的正文;
基于預設實體識別規則對所述正文進行識別,得到第一實體信息,基于預設實體識別模型對所述正文進行識別,得到第二實體信息;
根據所述第一實體信息和所述第二實體信息確定所述電子文檔的目標實體信息。
第二方面,本申請實施例提供一種實體識別裝置,其中:
存儲單元,用于預設實體識別規則和預設實體識別模型;
處理單元,用于提取待識別的電子文檔中的正文;基于所述預設實體識別規則對所述正文進行識別,得到第一實體信息,基于所述預設實體識別模型對所述正文進行識別,得到第二實體信息;根據所述第一實體信息和所述第二實體信息確定所述電子文檔的目標實體信息。
第三方面,本申請實施例提供一種電子設備,包括處理器、存儲器、通信接口以及一個或至少一個程序,其中,上述一個或至少一個程序被存儲在上述存儲器中,并且被配置由上述處理器執行,所述程序包括用于如第一方面中所描述的部分或全部步驟的指令。
第四方面,本申請實施例提供了一種計算機可讀存儲介質,其中,所述計算機可讀存儲介質存儲計算機程序,其中,所述計算機程序使得計算機執行以實現如第一方面中所描述的部分或全部步驟。
實施本申請實施例,將具有如下有益效果:
采用了上述的實體識別方法、裝置、電子設備及存儲介質之后,先提取待識別的電子文檔中的正文,再分別基于預設實體識別規則和預設實體識別模型對正文進行識別,得到第一實體信息和第二實體信息,然后根據第一實體信息和第二實體信息確定電子文檔的目標實體信息。如此,通過兩種不同的識別方法進行實體識別,再確定電子文檔的目標實體信息,可提高識別實體的準確率,便于提高電子文檔的使用范圍。
附圖說明
為了更清楚地說明本申請實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
其中:
圖1為本申請實施例提供的一種實體識別方法的流程示意圖;
圖2為本申請實施例提供的一種預設實體識別模型的訓練方法的流程示意圖;
圖3為本申請實施例提供的一種實體識別裝置的結構示意圖;
圖4為本申請實施例提供的一種電子設備的結構示意圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110386195.8/2.html,轉載請聲明來源鉆瓜專利網。





