[發明專利]一種文本信息智能處理系統在審
| 申請號: | 202211113958.2 | 申請日: | 2022-09-14 |
| 公開(公告)號: | CN115455935A | 公開(公告)日: | 2022-12-09 |
| 發明(設計)人: | 林欣;李楷達 | 申請(專利權)人: | 華東師范大學 |
| 主分類號: | G06F40/205 | 分類號: | G06F40/205;G06F40/258;G06F40/279;G06F16/33;G06F16/35;G06F16/36;G06F40/103;G06N3/08;G06N5/02 |
| 代理公司: | 上海藍迪專利商標事務所(普通合伙) 31215 | 代理人: | 徐筱梅;張翔 |
| 地址: | 200241 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 信息 智能 處理 系統 | ||
本發明公開了一種文本信息智能處理系統,其特點是該系統由文本預處理、知識圖譜構建和知識查詢與問答三個子系統組成,所述文本預處理子系統實現對文檔讀取、掃描和實體抽取等預處理;所述知識圖譜構建子系統抽取文檔中的關系等知識圖譜的基本元素,采用實體匹配、知識融合將這些元素增量更新至知識圖譜中,并實現可視化;所述知識查詢與問答子系統利用構建好的知識圖譜,實現對文檔知識的動態查詢與問答應對。本發明與現有技術相比具有自動處理各類文檔,構建領域知識圖譜對其中的關鍵信息進行存儲、管理、展示,并基于構建好的知識圖譜對用戶輸入的問題實現基于語義的知識搜索和問答功能,為各領域的相關業務職能效率提升提供技術手段支撐。
技術領域
本發明涉及知識圖譜和光學字符識別技術領域,尤其是一種文本信息智能處理系統的實現方法。
背景技術
知識圖譜技術作為新一代人工智能領域內的代表性技術,能夠幫助滿足運維工程進行知識檢索的需求,具體體現在:1)在圖譜的構建過程中,可以處理文本類半結構化數據并存儲后加以利用,從而達到全文搜索的目的;2)基于知識圖譜的搜索是針對命名實體的,而不僅僅是文字匹配;3)命名實體之間用關系串聯,信息檢索結果并可以遵循關系路徑進行擴展。
目前,已經有學者將其引入信息管理領域,如王雪將知識圖譜技術應用于人口信息查詢領域,解決了人工信息數據可視化以及智能化檢索的問題;雷潔等利用Protege工具進行科研檔案管理的本體設計,將與之相關的科研人員信息、科研團隊信息、財務信息等都進行統一存儲,為科研檔案智能化應用做鋪墊;翟興等利用知識圖譜技術管理健康養生信息,同時能提供人工交互、信息推介、問題轉發等功能。
光學字符識別(Optical Character Recognition,OCR)是指對文本資料的圖像文件進行分析識別處理,獲取文字及版面信息的過程。亦即將圖像中的文字進行識別,并以文本的形式返回。文本識別是在文本檢測的基礎上,對文本內容進行識別,將圖像中的文本信息轉化為文本信息。文字識別主要解決的問題是每個文字是什么,識別出的文本通常需要再次核對以保證其正確性。文本校正也被認為屬于這一環節,而其中當識別的內容是由詞庫中的詞匯組成時,稱作有詞典識別(Lexicon-based),反之稱作無詞典識別(Lexicon-free)。
現有技術的文檔信息檢索自動化處理和計算能力低,成本高,文檔信息管理繁瑣、復雜,智能問答的效果差,文檔處理系統通常不能兼顧智能問答與可視化功能,用戶在使用時不夠便利。
發明內容
本發明的目的是針對現有技術的不足而提供的一種文本信息智能處理系統,采用文本預處理子系統、知識圖譜構建子系統和知識查詢與問答子系統構建的智能系統為文本信息處理工具,實現對文檔知識的動態查詢與問答應對的智能處理,通過利用知識圖譜、OCR等領域技術,實現對大量文檔數據的自動化處理和計算,為使用者提供高效的文檔信息檢索和智能問答功能,實現減少文檔信息管理、檢索成本的效果。該工具通過自動處理各類文檔,構建領域知識圖譜對其中的關鍵信息進行存儲、管理、展示,并基于構建好的知識圖譜對用戶輸入的問題實現基于語義的知識搜索和問答功能,為各領域的相關業務職能效率提升提供技術手段支撐。
實現本發明目的的具體技術方案是:一種文本信息智能處理系統,其特點是采用文本預處理子系統、知識圖譜構建子系統和知識查詢與問答子系統構建的智能系統為文本信息處理工具,實現對文檔知識的動態查詢與問答應對的智能處理,通過文本預處理子系統、知識圖譜構建子系統和知識查詢與問答子系統中的九個模塊:源文檔信息抽取模塊、基于目錄的粗粒度圖譜構建模塊、實體抽取模塊、關系挖掘與補全模塊、圖譜數據預處理模塊、知識圖譜插入模塊、知識圖譜可視化模塊、問題答案生成模塊和候選答案排序及輸出模塊進行聯動配合,實現文檔自動化處理、關鍵信息抽取、圖譜構建和智能問答功能。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華東師范大學,未經華東師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211113958.2/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





