[發明專利]信息提取方法、裝置、電子設備及存儲介質在審
| 申請號: | 202110452340.8 | 申請日: | 2021-04-25 |
| 公開(公告)號: | CN113177401A | 公開(公告)日: | 2021-07-27 |
| 發明(設計)人: | 任寧;劉大雙 | 申請(專利權)人: | 鼎富智能科技有限公司 |
| 主分類號: | G06F40/20 | 分類號: | G06F40/20;G06Q10/10 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 張萌 |
| 地址: | 230000 安徽省合肥市*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息 提取 方法 裝置 電子設備 存儲 介質 | ||
本申請提供一種信息提取方法、裝置、電子設備及存儲介質,包括:獲取待處理文本;從所述待處理文本中,確定出與合同簽署方的關鍵字關聯的文本信息;在確定所述文本信息不為空時,將所述關鍵字和所述文本信息對應輸出。在上述實現過程中,由于合同簽署方信息與合同簽署方的關鍵字存在關聯關系,因此,通過從所述待處理文本中,快速、自動地確定出與合同簽署方的關鍵字關聯的文本信息,并在確定所述文本信息不為空時,快速地將所述關鍵字和所述文本信息對應輸出,以使用戶能夠快速、且準確地了解到合同簽署方的信息,與采用人工的方式查找出合同簽署方的信息相比,效率高,且無需花費人工查找成本。
技術領域
本申請涉及信息技術領域,具體而言,涉及一種信息提取方法、裝置、電子設備及存儲介質。
背景技術
針對需要確定出合同簽署方信息的合同,在現有技術中,通常是采用人工的方式查找出合同簽署方的信息,然而,在需要確定合同簽署方的信息的合同數量比較多,且合同簽署方的信息在合同中的位置不確定的情況下,采用人工的方式勢必會花費較多的時間,且成本高。
發明內容
鑒于此,本申請實施例的目的在于提供一種信息提取方法、裝置、電子設備及存儲介質,以解決上述問題。
第一方面,本申請實施例提供一種信息提取方法,所述方法包括:獲取待處理文本;從所述待處理文本中,確定出與合同簽署方的關鍵字關聯的文本信息;在確定所述文本信息不為空時,將所述關鍵字和所述文本信息對應輸出。
在上述實現過程中,由于合同簽署方信息與合同簽署方的關鍵字存在關聯關系,因此,通過從所述待處理文本中,快速、自動地確定出與合同簽署方的關鍵字關聯的文本信息,并在確定所述文本信息不為空時,快速地將所述關鍵字和所述文本信息對應輸出,以使用戶能夠快速、且準確地了解到合同簽署方的信息,與現有技術相比,效率高,且無需花費人工查找成本。
基于第一方面,在一種可能的設計中,所述獲取待處理文本,包括:獲取待處理的原始文本;去除所述原始文本中的空格和/或空行,和/或屬于附件的內容,得到所述待處理文本。
在上述實現過程中,由于原始文本中的空格、空行和附件的內容中不會存在合同簽署方的信息,因此,通過去除所述原始文本中的空格和/或空行,和/或屬于附件的內容,以使得到的待處理文本的內容簡略,繼而降低后續從待處理文本中確定出合同方簽署信息的復雜度。
基于第一方面,在一種可能的設計中,所述方法還包括:從所述原始文本中,確定出包括字符甲方和字符乙方的起始行;從所述起始行開始,若從上至下,確定出包括兩個相同的關鍵詞的目標行,則確定距離所述起始行最近的目標行與所述起始行的間距是否小于等于預設行數;若所述間距小于等于所述預設行數,則從所述原始文本中,將所述起始行的內容、所述目標行的內容、以及所述起始行與所述目標行之間的內容刪除。
在上述實現過程中,通過從原始文本中,確定出同時存在字符甲方和字符乙方的起始行,繼而從起始行開始,從上至下,確定出包括兩個相同的關鍵詞的目標行,且在距離起始行最近的目標行與處行的間距小于等于預設行數的情況下,可以確定起始行至目標行中的內容中不存在合同簽署方的信息,因此,從所述原始文本中,將所述起始行的內容、所述目標行的內容、以及所述起始行與所述目標行之間的內容刪除,以使最終得到的待處理文本更簡略,繼而降低后續從待處理文本中確定出合同方簽署信息的復雜度。
基于第一方面,在一種可能的設計中,從所述待處理文本中,確定出與合同簽署方的關鍵字關聯的文本信息,包括:從所述待處理文本中,確定出與所述關鍵字位于同一行,且位于所述關鍵字右側的所述文本信息。
在上述實現過程中,由于合同簽署方信息一般位于合同簽署方的關鍵字的右側,且與其處于同一行,因此,從所述待處理文本中,確定出與所述關鍵字位于同一行,且位于所述關鍵字右側的所述文本信息,繼而實現快速、準確地確定出合同簽署方信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鼎富智能科技有限公司,未經鼎富智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110452340.8/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





