[發明專利]一種基于標準文獻的查詢比對系統在審
| 申請號: | 202011296687.X | 申請日: | 2020-11-18 |
| 公開(公告)號: | CN112380361A | 公開(公告)日: | 2021-02-19 |
| 發明(設計)人: | 張凡;陳浩敏;姚森敬;于力;辛文成;席禹 | 申請(專利權)人: | 南方電網數字電網研究院有限公司 |
| 主分類號: | G06F16/383 | 分類號: | G06F16/383;G06F16/338;G06F16/35;G06F40/194 |
| 代理公司: | 廣東創興方舟知識產權代理事務所(普通合伙) 44732 | 代理人: | 耿曉岳 |
| 地址: | 510000 廣東省廣州市黃*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 標準 文獻 查詢 系統 | ||
本發明公開了一種基于標準文獻的查詢比對系統,包括數據采集模塊、數據預處理模塊、數據存儲模塊、大數據信息處理模塊、數據比對模塊、數據分析模塊、監測控制模塊;所述數據采集模塊通過數據預處理模塊和數據存儲模塊將采集的信息傳輸至大數據信息處理模塊,該大數據信息處理模塊分別控制所述數據比對模塊和監測控制模塊;所述數據分析模塊將分析處理后信息傳輸至該大數據信息處理模塊。本發明在于提供一種能夠精準分析數據,功能多樣,檢索比對分析準確率高,可靠性強的一種基于標準文獻的查詢比對系統。
技術領域
本發明涉及大數據系統技術領域,尤其涉及一種基于標準文獻的查詢比對系統。
背景技術
目前,公司內的標準文獻服務系統還停留在基于關鍵字的文獻檢索層次,標準文獻的加工力度較粗,未能深入到標準文獻內部的語義知識單元,忽視了標準文獻知識單元之間的關聯管理,只能提供簡單的文獻搜索、下載功能,不能為用戶提供面向深層次的標準文獻服務。具體問題包括:
(1)語義數據缺失。由于標準文獻的版權問題導致了標準文獻機器可讀取全文數據獲取困難,當前大多數文獻以PDF圖像掃描件的形式儲存,導致了計算機難以讀取標準文獻內容信息。因此,多數系統通過光符識別技術對標準文獻進行轉化處理,獲取相應純文本數據。然而,純文本數據在解決內容讀取問題的同時,也導致了原始文本的結構丟失,不利于標準文獻的語義加工及語義知識組織。
(2)領域本體復雜,人工構建困難。由于標準文獻覆蓋不同專業、行業、涉及眾多科學知識內容,本體內容比較復雜,難以構建一個通用的知識本體,且人工構建的方式需要消耗大量的人力成本。
因此,亟需對標準文獻內容進行語義組織和知識抽取,從文獻服務向知識服務系統轉變。針對上述問題,項目將建設面向知識層面的電力標準知識服務系統。通過“云大物移智”等技術實現電力標準的語義組織、知識抽取、本體構建,建立電力標準數據庫,再將電力標準知識數據以圖數據庫的方式實現電力標準知識的高效存儲和查詢功能。應用信息可視化技術構建電力標準知識圖譜,實現電力標準信息的可視化,提供直觀的標準層級關系,提高電力標準文檔服務的效率和精確性。基于電力標準知識圖譜,為用戶提供標準體系管理技術,可根據預設的行業分類維度管理標準資源。在可視化電力標準知識圖譜的基礎上通過基于語義模型的電力標準搜索技術為用戶提供電力標準的全文搜索應用功能,提供給用戶更加智能、精確、人性化的結果。研究開發標準自動對比分析應用功能,為用戶提供電力標準比對分析服務,協助用戶標準創作,同時提高標準使用的效率。研究開發標準熱點及前沿分析應用功能,實現根據用戶輸入的標準信息自動分析對應的研究熱點及技術前沿結果信息。
中國專利申請號為:201910226293.8,申請日是:2019年03月25日,公開日是:2020年07月05日,專利名稱為:一種基于大數據分析的歷史文獻分類存儲方法,公開了一種基于大數據分析的歷史文獻分類存儲方法,包括數據接收模塊、數據整理模塊、處理器、瀏覽模塊、文獻狀態查詢模塊、借閱模塊、存儲模塊、更新模塊和備份模塊,其中,所述數據接收模塊用于接收員工輸入的文獻信息,所述文獻信息包括文獻名稱、文獻首字母以及文獻入庫時間,所述數據接收模塊將文獻信息傳輸到數據整理模塊內,所述數據整理模塊用于對數據接收模塊傳輸的文獻信息進行分類整理,本發明通過存儲模塊更新模塊和備份模塊的設置,便于對文獻信息的存儲和對更新文獻信息的替換,以及對文獻信息的備份,防止出現存儲重復,文獻信息備份錯亂,浪費工作人員重新整理的時間,降低工作效率。
上述專利文獻公開了一種基于大數據分析的歷史文獻分類存儲方法,雖然該專利可以通過大數據分析進行歷史文獻分類,但是,該專利技術對于文獻分類檢索顯得功能不齊全,缺乏檢索比對分析,分類不夠精準,不能滿足廣大閱讀者的需求。
發明內容
有鑒于此,本發明在于提供一種能夠精準分析數據,功能多樣,檢索比對分析準確率高,可靠性強的一種基于標準文獻的查詢比對系統。
為了實現本發明目的,可以采取以下技術方案:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南方電網數字電網研究院有限公司,未經南方電網數字電網研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011296687.X/2.html,轉載請聲明來源鉆瓜專利網。





