[發(fā)明專利]一種具有智能檢測功能的數(shù)據處理方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201410291108.0 | 申請日: | 2014-06-24 |
| 公開(公告)號: | CN104133839A | 公開(公告)日: | 2014-11-05 |
| 發(fā)明(設計)人: | 吳觀斌;李紅梅;李勇;許乃媛;陳素紅;傅蓬;王慧慧 | 申請(專利權)人: | 國家電網公司;國網山東省電力公司電力科學研究院;山東億云信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 張勇 |
| 地址: | 100031 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 具有 智能 檢測 功能 數(shù)據處理 方法 系統(tǒng) | ||
技術領域
本發(fā)明涉及一種具有智能檢測功能的數(shù)據處理方法及系統(tǒng)。
背景技術
目前的科技獎勵管理項目在數(shù)據處理上具有以下缺點:
科技獎勵管理項目的數(shù)據量大,每年都有大量的數(shù)據需要處理,在處理的過程中,數(shù)據的篩選不夠合理,另外,現(xiàn)有的系統(tǒng)缺乏自動查重、自動處理的功能。
大量、繁瑣數(shù)據的篩選難度大,處理過程不夠合理,原有系統(tǒng)對數(shù)據進行一次篩選,篩選依據單一,人為干預因素多,缺乏公平合理性。人工處理數(shù)據工作量大、效率低,原有系統(tǒng)需要人工進行數(shù)據的查閱比對,工作效率低,任務繁重。
在申報科技獎勵時,填報的申報材料較多,當申報材料填寫的為項目名稱或論文論著名稱時及項目完成人及專利文獻時,需要根據名稱判斷是否存在重復申請的嫌疑,目前,該工作均是通過人為識別,由于申報數(shù)據的量大,人為識別精確度不夠。
發(fā)明內容
本發(fā)明的目的就是為了解決上述問題,提供一種項目申報數(shù)據處理方法及系統(tǒng),本發(fā)明的數(shù)據判斷優(yōu)勢在于系統(tǒng)自動提取查重因素,進行復雜匹配計算,減少人為因素,提高查重結果的公正和正確性,減輕工作人員工作量,極大提高工作效率。
為了實現(xiàn)上述目的,本發(fā)明采用如下技術方案:
一種具有智能檢測功能的數(shù)據處理方法,包括如下步驟:
步驟一:通過JS腳本自動檢測當前用戶使用瀏覽器版本,對于非IE系列瀏覽器給予提示,并關閉;檢測使用瀏覽器符合要求即進入系統(tǒng)進行數(shù)據采集;
步驟二:將遠程數(shù)據采集終端通過手寫板采集完成人筆跡存儲至筆跡特征庫,采集的申報項目的數(shù)據信息存儲到網絡服務器的緩存區(qū),主計算機調用網絡服務器的緩存區(qū)的申報項目的數(shù)據信息并存儲到主計算機的第一緩存區(qū);采集的圖片、Word和PDF文檔數(shù)據以文件形式存儲至主計算機的第二緩存區(qū),將文檔相對路徑存儲至項目申報數(shù)據庫附件子數(shù)據表中;
步驟三:主計算機讀取第一緩存區(qū)中的申報項目的信息,判斷數(shù)據是否符合要求;對于圖片文檔,利用項目申報數(shù)據庫附件子數(shù)據表中文檔路徑調用主計算機的第二緩存區(qū)圖片文檔,利用圖像識別模塊讀取圖片文檔內容,識別完成人筆跡與筆跡特征庫進行比對,完成單位蓋章與完成單位數(shù)據表完成單位名稱是否相符,如果筆跡特征庫中筆跡信息、項目申報數(shù)據表中申報項目的信息及圖片文檔均符合要求就進入步驟四,如果不符合就返回步驟二;
步驟四:將步驟三中符合要求的項目數(shù)據從項目申報數(shù)據庫同步到評審數(shù)據庫,該同步過程采取單向同步;對評審數(shù)據庫的申報信息進行三次篩選,并將最終數(shù)據輸出在服務器的瀏覽頁面上。
所述步驟二中具體為:將與項目直接相關的數(shù)據存儲到項目申報庫主數(shù)據表中,每條數(shù)據對應唯一項目編號,與項目間接相關的數(shù)據存儲到項目申報庫各子數(shù)據表中,子數(shù)據表中將唯一項目編號設置為外鍵與主數(shù)據表關聯(lián);申報數(shù)據庫的子數(shù)據表中還存儲有歷史項目申報信息。
所述直接相關的數(shù)據包括項目基本信息;間接相關的數(shù)據包括項目簡介、主要科技創(chuàng)新、第三方評價、社會經濟效益、曾獲科技獎勵、完成人、完成單位、推薦單位意見、知識產權、論文論著及附件;
所述項目基本信息包括:項目名稱、項目學科、技術領域、項目來源及所屬國民經濟行業(yè)等;所述知識產權包括:專利申請?zhí)枴@Q、發(fā)明人和專利授權日;所述完成人包括:完成人的姓名、身份證號和完成人順序。所述步驟一中數(shù)據存儲形式包括:數(shù)據表、圖片、Word文檔及PDF文檔。存儲為不同格式數(shù)據,數(shù)據表便于查詢、統(tǒng)計,圖片及PDF文檔確保數(shù)據真實性,Word文檔為了便于保持數(shù)據原有格式,便于查看。
所述步驟三中,對項目申報庫各子數(shù)據表存儲的數(shù)據進行分詞或者直接匹配,利用判斷模塊判斷當前的申報項目的信息是否為項目名稱或論文論著名稱,如果是就進入關鍵詞比較模塊,如果不是,再進行判斷是否為項目的完成人姓名及身份證號或知識產權號,如果是,則進入直接匹配模塊。
利用關鍵詞比較模塊將當前的申報項目的信息的項目名稱或論文論著名稱與歷史項目申報信息中的另一申報項目的項目名稱或論文論著名稱的關鍵詞比較,如果相似度不低于設定值,判定重復,否則不重復;
利用直接匹配模塊將當前的申報項目的信息項目的完成人姓名及身份證號或知識產權號與歷史項目申報信息中的另一申報項目的項目完成人姓名及身份證號或知識產權號直接進行匹配,如果相同判定重復,否則不重復;
利用存儲模塊將關鍵詞比較模塊及直接匹配模塊判定不重復申報項目的信息存儲到主計算機的緩存區(qū),將判定重復的申報項目的信息存儲到主計算機中的項目申報數(shù)據庫查重表中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家電網公司;國網山東省電力公司電力科學研究院;山東億云信息技術有限公司,未經國家電網公司;國網山東省電力公司電力科學研究院;山東億云信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410291108.0/2.html,轉載請聲明來源鉆瓜專利網。





