[發明專利]一種具有自動分析輔助決策的項目查重系統在審
| 申請號: | 202211259545.5 | 申請日: | 2022-10-14 |
| 公開(公告)號: | CN115757751A | 公開(公告)日: | 2023-03-07 |
| 發明(設計)人: | 李方軍;王瓊;王晶;高建勇;張珍芬;劉志遠;周永博 | 申請(專利權)人: | 國網甘肅省電力公司信息通信公司;甘肅同興智能科技發展有限責任公司 |
| 主分類號: | G06F16/335 | 分類號: | G06F16/335;G06F16/31;G06F40/216;G06F40/284;G06N3/08 |
| 代理公司: | 深圳市賓亞知識產權代理有限公司 44459 | 代理人: | 黃磊 |
| 地址: | 730050 甘肅*** | 國省代碼: | 甘肅;62 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 具有 自動 分析 輔助 決策 項目 系統 | ||
本發明涉及一種具有自動分析輔助決策的項目查重系統,包括采集模塊、關鍵詞提取模塊、識別模塊、查重輔助模塊、查重模塊;設置查重輔助模塊將當前關鍵詞的相關詞與歷史關鍵詞進行對比,并在當前關鍵詞或者當前關鍵詞的相關詞與歷史關鍵詞一致時,將歷史關鍵詞對應的相關材料作為輔助決策輸出;設置查重模塊將當前關鍵詞輸入至預先設置的數據庫中進行檢索,得到與當前關鍵詞相關的關聯材料,并根據關聯材料計算待查詢資料的重復度。本發明通過識別模塊對關鍵詞進行識別和擴展,然后通過查重輔助模塊對擴展后的相關詞的關聯材料進行輸出展示,輔助查重人員的關鍵詞決策;從而幫助查重人員進行關鍵詞擴展和相關資料搜集,從而提高查重的準確率。
技術領域
本發明涉及數據查重技術領域,具體是一種具有自動分析輔助決策的項目查重系統。
背景技術
查重,是指將自己的文章與數據庫中的文章進行對比,從檢測抄襲率,并檢測文章的原創度;
傳統的文章查重系統經常采用關鍵字詞查詢比照的方式,利用自身對文章的理解獲取關鍵詞,然后利用關鍵詞檢索相關文獻,進行相關度比對;但是由于個人理解的局限性,輸入的關鍵詞可能不夠準確,從而無法找到足夠數量的相關文獻,從而影響查重準確率。
發明內容
有鑒于此,本發明的目的是提供一種具有自動分析輔助決策的項目查重系統,能夠解決現有技術中通過個人對文獻的理解輸入關鍵詞導致的查重準確率不高的技術問題。
為了實現上述目的,本發明采用了如下技術方案:
本發明的一種具有自動分析輔助決策的項目查重系統,包括:
采集模塊,用于獲取待查詢資料、查重歷史數據;所述查重歷史數據包括歷史關鍵詞和與所述歷史關鍵詞對應的相關材料;
關鍵詞提取模塊,用于從所述待查詢資料中提取當前關鍵詞;
識別模塊,用于對所述當前關鍵詞進行識別,得到與所述當前關鍵詞的相關詞;
查重輔助模塊,用于將所述當前關鍵詞的相關詞與所述歷史關鍵詞進行對比,并在所述當前關鍵詞或者所述當前關鍵詞的相關詞與所述歷史關鍵詞一致時,將所述歷史關鍵詞對應的相關材料作為輔助決策輸出;
查重模塊,用于將所述當前關鍵詞輸入至預先設置的數據庫中進行檢索,得到與所述當前關鍵詞相關的關聯材料,并根據所述關聯材料計算所述待查詢資料的重復度。
可選地,所述查重系統還包括:
歷史數據更新模塊,用于以所述當前關鍵詞、所述關聯材料構建當前查重數據,并根據所述當前查重數據對所述歷史查重數據進行更新。
可選地,所述關鍵詞提取模塊包括:
第一標記單元,用于對所述待查詢資料中的自選字段進行標記,得到標記詞;
第一篩選單元,用于對所述待查詢資料中包含標記詞的單句進行篩選,得到標記單句;
第一分詞單元,用于對所述標記單句進行分詞,得到多個單詞;
第二篩選單元,用于從所述多個單詞中篩選出包含自選字段的單詞;
第一統計單元,用于對所述包含自選字段的單詞進行統計,并將重復次數超過預設閾值的包含自選字段的單詞作為關鍵詞。
可選地,所述識別模塊包括:
模型構建單元,用于根據預先建立的訓練數據集對人工神經網絡進行訓練得到,得到識別模型;所述訓練數據集包括多個關鍵詞、多個關鍵詞的相關詞、識別結果;
識別單元,用于通過所述識別模型對對所述當前關鍵詞進行識別,得到與所述當前關鍵詞的相關詞,所述當前關鍵詞的相關詞包括所述當前關鍵詞的同義詞、近義詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網甘肅省電力公司信息通信公司;甘肅同興智能科技發展有限責任公司,未經國網甘肅省電力公司信息通信公司;甘肅同興智能科技發展有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211259545.5/2.html,轉載請聲明來源鉆瓜專利網。





