[發明專利]一種具有圖像識別功能的數據處理方法及系統在審
| 申請號: | 201410288528.3 | 申請日: | 2014-06-24 |
| 公開(公告)號: | CN104156386A | 公開(公告)日: | 2014-11-19 |
| 發明(設計)人: | 李紅梅;李華東;李勇;吳觀斌;許乃媛;傅蓬;王慧慧 | 申請(專利權)人: | 國家電網公司;國網山東省電力公司電力科學研究院;山東億云信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q10/06 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 張勇 |
| 地址: | 250002 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 具有 圖像 識別 功能 數據處理 方法 系統 | ||
技術領域
本發明涉及一種具有圖像識別功能的數據處理方法及系統。
背景技術
目前的科技獎勵管理項目在數據處理上具有以下缺點:
科技獎勵管理項目的數據量大,每年都有大量的數據需要處理,在處理的過程中,數據的篩選不夠合理,另外,現有的系統缺乏自動查重、自動處理的功能。
大量、繁瑣數據的篩選難度大,處理過程不夠合理,原有系統對數據進行一次篩選,篩選依據單一,人為干預因素多,缺乏公平合理性。人工處理數據工作量大、效率低,原有系統需要人工進行數據的查閱比對,工作效率低,任務繁重。
在申報科技獎勵時,填報的申報材料較多,當申報材料填寫的為項目名稱或論文論著名稱時及項目完成人及專利文獻時,需要根據名稱判斷是否存在重復申請的嫌疑,目前,該工作均是通過人為識別,由于申報數據的量大,人為識別精確度不夠。
發明內容
本發明的目的就是為了解決上述問題,提供一種項目申報數據處理方法及系統,本發明的數據判斷優勢在于系統自動提取查重因素,進行復雜匹配計算,減少人為因素,提高查重結果的公正和正確性,減輕工作人員工作量,極大提高工作效率。
為了實現上述目的,本發明采用如下技術方案:
一種具有圖像識別功能的數據處理方法,包括如下步驟:
步驟一:采集的申報項目的數據信息存儲到網絡服務器的緩存區,主計算機調用網絡服務器的緩存區的申報項目的數據信息并存儲到主計算機的第一緩存區;采集的圖片、Word和PDF文檔數據以文件形式存儲至主計算機的第二緩存區,將文檔相對路徑存儲至項目申報數據庫的附件子數據表中;
步驟二:主計算機讀取第一緩存區中的申報項目的信息,判斷數據是否符合要求;對于圖片文檔,利用項目申報數據庫附件子數據表中文檔路徑調用主計算機的第二緩存區圖片文檔,利用圖像識別模塊讀取圖片文檔內容,判斷完成單位蓋章、完成單位數據表及完成單位名稱是否相符,如果項目申報數據表中申報項目的信息及圖片文檔均符合要求就進入步驟三,如果不符合就返回步驟一;
步驟三:將步驟二中符合要求的項目數據從項目申報數據庫同步到評審數據庫,該同步過程采取單向同步;對評審數據庫的申報信息進行三次篩選,并將最終數據輸出在服務器的瀏覽頁面上。
所述步驟一中具體為:將與項目直接相關的數據存儲到項目申報庫主數據表中,每條數據對應唯一項目編號,與項目間接相關的數據存儲到項目申報庫各子數據表中,子數據表中將唯一項目編號設置為外鍵與主數據表關聯;申報數據庫的子數據表中還存儲有歷史項目申報信息。
所述直接相關的數據包括項目基本信息;間接相關的數據包括項目簡介、主要科技創新、第三方評價、社會經濟效益、曾獲科技獎勵、完成人、完成單位、推薦單位意見、知識產權、論文論著及附件;
所述項目基本信息包括:項目名稱、項目學科、技術領域、項目來源及所屬國民經濟行業等;所述知識產權包括:專利申請號、專利名稱、發明人和專利授權日;所述完成人包括:完成人的姓名、身份證號和完成人順序。所述步驟一中數據存儲形式包括:數據表、圖片、Word文檔及PDF文檔。存儲為不同格式數據,數據表便于查詢、統計,圖片及PDF文檔確保數據真實性,Word文檔為了便于保持數據原有格式,便于查看。
所述步驟二中,對項目申報數據庫的各子數據表存儲的數據進行分詞或者直接匹配,利用判斷模塊判斷當前的申報項目的信息是否為項目名稱或論文論著名稱,如果是就進入關鍵詞比較模塊,如果不是,再進行判斷是否為項目的完成人姓名及身份證號或知識產權號,如果是,則進入直接匹配模塊。
利用關鍵詞比較模塊將當前的申報項目的信息的項目名稱或論文論著名稱與歷史項目申報信息中的另一申報項目的項目名稱或論文論著名稱的關鍵詞比較,如果相似度不低于設定值,判定重復,否則不重復;
利用直接匹配模塊將當前的申報項目的信息項目的完成人姓名及身份證號或知識產權號與歷史項目申報信息中的另一申報項目的項目完成人姓名及身份證號或知識產權號直接進行匹配,如果相同判定重復,否則不重復;
利用存儲模塊將關鍵詞比較模塊及直接匹配模塊判定不重復申報項目的信息存儲到主計算機的緩存區,將判定重復的申報項目的信息存儲到主計算機中的項目申報數據庫查重表中。
所述關鍵詞比較模塊將當前的申報項目的信息的項目名稱或論文論著名稱與歷史項目申報信息中的另一申報項目的項目名稱或論文論著名稱的關鍵詞比較,如果相似度不低于設定值,判定重復,否則不重復,具體過程為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家電網公司;國網山東省電力公司電力科學研究院;山東億云信息技術有限公司,未經國家電網公司;國網山東省電力公司電力科學研究院;山東億云信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410288528.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:大數據環境下提高數據庫性能的方法及系統
- 下一篇:業務數據處理方法及系統
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





