[發明專利]項目申報數據的查重系統及方法在審
| 申請號: | 201710591752.3 | 申請日: | 2017-07-19 |
| 公開(公告)號: | CN110020026A | 公開(公告)日: | 2019-07-16 |
| 發明(設計)人: | 孫海彬;張番;胡偉;楊楓;徐信艷;朱偉;賈平 | 申請(專利權)人: | 上海互寶能源科技有限責任公司 |
| 主分類號: | G06F16/93 | 分類號: | G06F16/93;G06F16/22;G06F16/2458;G06F16/33 |
| 代理公司: | 上海弼興律師事務所 31283 | 代理人: | 胡美強;李夢男 |
| 地址: | 201306 上海市浦*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 非文本數據 項目申報 非關系型數據庫 輸入模板 索引庫 數據輸入模塊 多個項目 獲取數據 歷史數據 匹配分析 生成數據 索引存儲 相似度 準確率 索引 存儲 反饋 申報 創建 | ||
本發明公開了一種項目申報數據的查重系統及方法,查重系統包括:非關系型數據庫,用于存儲多個項目申報歷史數據中的歷史非文本數據,并提取歷史非文本數據中的特征值以創建索引,還將索引存儲于索引庫中;數據輸入模塊,用于生成數據輸入模板,并獲取數據輸入模板接收的待查重的項目申報數據中的待查非文本數據;查重模塊,用于提取待查非文本數據中的待查特征值,并將待查特征值與索引庫中的所有特征值進行匹配分析,以獲取非關系型數據庫反饋的包括待查特征值的所有歷史非文本數據,查重模塊還用于根據所有歷史非文本數據計算待查非文本數據的相似度。本發明實現了對項目申報數據中的非文本數據進行查重,大大提高了查重準確率。
技術領域
本發明涉及一種數據查重系統,特別涉及一種創新創業項目申報數據的查重系統及方法。
背景技術
目前,我國每年有大量在校學生及科研人員會申報國家、省地各級各類創新創業項目。為了提高創新創業項目的創新高度,項目評審前需要對其進行查重。現有技術中,有許多網站能提供查重功能,但該些網站只能進行文本查重,不能實現非文本(表格、圖像、網頁等)查重,故有些項目申報者會通過將文本數據轉換為非文本數據來規避查重,以降低其項目論文的相似度。
發明內容
本發明要解決的技術問題是為了克服現有技術中的查重系統不能進行非文本查重的缺陷,提供一種項目申報數據的查重系統及方法。
本發明是通過下述技術方案來解決上述技術問題:
一種項目申報數據的查重系統,其特點在于,所述查重系統包括:
非關系型數據庫,用于存儲多個項目申報歷史數據中的歷史非文本數據,并提取所述歷史非文本數據中的特征值以創建索引,所述非關系型數據庫還用于將所述索引存儲于索引庫中;
數據輸入模塊,用于生成數據輸入模板,并獲取數據輸入模板接收的待查重的項目申報數據中的待查非文本數據;
查重模塊,用于提取所述待查非文本數據中的待查特征值,并將所述待查特征值與所述索引庫中的所有特征值進行匹配分析,以獲取非關系型數據庫反饋的包括所述待查特征值的所有歷史非文本數據,所述查重模塊還用于根據所述所有歷史非文本數據計算所述待查非文本數據的相似度。
較佳地,所述查重系統還包括:關系型數據庫;
所述關系型數據庫用于存儲所述項目申報歷史數據中的歷史文本數據;
所述數據輸入模塊還用于獲取所述數據輸入模板接收的待查重的項目申報數據中的待查文本數據;
所述查重模塊還用于將所述待查文本數據與所述關系型數據庫中的所有歷史文本數據進行匹配分析,并計算所述待查文本數據的相似度。
較佳地,所述查重模塊還用于獲取查詢條件,并根據所述查詢條件提取所述待查文本數據中的內容數據作為待查文本數據和/或待查非文本數據。
較佳地,所述內容數據包括以下數據中的至少一種:
項目標題、關鍵詞、研究意義、國內外研究現狀、研究目標、研究內容、擬解決的關鍵問題、項目名稱、項目申請理由、立論依據、研究方案、特色與創新、擬解決的關鍵問題、計劃進度、研究基礎和預期研究成果。
較佳地,所述非文本數據包括以下數據中的至少一種:
圖像數據、表格數據和網頁數據。
較佳地,所述查重模塊包括圖像查重單元和文本查重單元;
所述數據輸入模塊還用于從所述圖像數據和/或所述表格數據和/或所述網頁數據中獲取待查文本數據并發送至所述文本查重單元;
所述圖像查重單元用于提取所述圖像數據中的圖像特征值,并將提取出的圖像特征值與所述索引庫中的圖像特征值進行匹配分析,并生成圖像數據的相似度;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海互寶能源科技有限責任公司,未經上海互寶能源科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710591752.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據處理方法及裝置
- 下一篇:一種基于情境感知的檔案檢索利用方法及系統





