[發明專利]項目申報數據的查重系統及方法在審
| 申請號: | 201710591752.3 | 申請日: | 2017-07-19 |
| 公開(公告)號: | CN110020026A | 公開(公告)日: | 2019-07-16 |
| 發明(設計)人: | 孫海彬;張番;胡偉;楊楓;徐信艷;朱偉;賈平 | 申請(專利權)人: | 上?;毮茉纯萍加邢挢熑喂?/a> |
| 主分類號: | G06F16/93 | 分類號: | G06F16/93;G06F16/22;G06F16/2458;G06F16/33 |
| 代理公司: | 上海弼興律師事務所 31283 | 代理人: | 胡美強;李夢男 |
| 地址: | 201306 上海市浦*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 非文本數據 項目申報 非關系型數據庫 輸入模板 索引庫 數據輸入模塊 多個項目 獲取數據 歷史數據 匹配分析 生成數據 索引存儲 相似度 準確率 索引 存儲 反饋 申報 創建 | ||
1.一種項目申報數據的查重系統,其特征在于,所述查重系統包括:
非關系型數據庫,用于存儲多個項目申報歷史數據中的歷史非文本數據,并提取所述歷史非文本數據中的特征值以創建索引,所述非關系型數據庫還用于將所述索引存儲于索引庫中;
數據輸入模塊,用于生成數據輸入模板,并獲取數據輸入模板接收的待查重的項目申報數據中的待查非文本數據;
查重模塊,用于提取所述待查非文本數據中的待查特征值,并將所述待查特征值與所述索引庫中的所有特征值進行匹配分析,以獲取非關系型數據庫反饋的包括所述待查特征值的所有歷史非文本數據,所述查重模塊還用于根據所述所有歷史非文本數據計算所述待查非文本數據的相似度。
2.如權利要求1所述的項目申報數據的查重系統,其特征在于,所述查重系統還包括:關系型數據庫;
所述關系型數據庫用于存儲所述項目申報歷史數據中的歷史文本數據;
所述數據輸入模塊還用于獲取所述數據輸入模板接收的待查重的項目申報數據中的待查文本數據;
所述查重模塊還用于將所述待查文本數據與所述關系型數據庫中的所有歷史文本數據進行匹配分析,并計算所述待查文本數據的相似度。
3.如權利要求2所述的項目申報數據的查重系統,其特征在于,所述查重模塊還用于獲取查詢條件,并根據所述查詢條件提取所述待查文本數據中的內容數據作為待查文本數據和/或待查非文本數據。
4.如權利要求3所述的項目申報數據的查重系統,其特征在于,所述內容數據包括以下數據中的至少一種:
項目標題、關鍵詞、研究意義、國內外研究現狀、研究目標、研究內容、擬解決的關鍵問題、項目名稱、項目申請理由、立論依據、研究方案、特色與創新、擬解決的關鍵問題、計劃進度、研究基礎和預期研究成果。
5.如權利要求2所述的項目申報數據的查重系統,其特征在于,所述非文本數據包括以下數據中的至少一種:
圖像數據、表格數據和網頁數據。
6.如權利要求5所述的項目申報數據的查重系統,其特征在于,所述查重模塊包括圖像查重單元和文本查重單元;
所述數據輸入模塊還用于從所述圖像數據和/或所述表格數據和/或所述網頁數據中獲取待查文本數據并發送至所述文本查重單元;
所述圖像查重單元用于提取所述圖像數據中的圖像特征值,并將提取出的圖像特征值與所述索引庫中的圖像特征值進行匹配分析,并生成圖像數據的相似度;
所述文本查重單元用于將所述待查文本數據與所述歷史文本數據進行匹配分析,并計算待查文本數據的相似度。
7.如權利要求2所述的項目申報數據的查重系統,其特征在于,所述查重模塊還用于統計所述待查非文本數據的相似度和所述待查文本數據的相似度,并計算所述待查重的項目申報數據的總相似度。
8.如權利要求7所述的項目申報數據的查重系統,其特征在于,所述查重模塊基于cosine算法計算所述待查非文本數據的相似度和/或所述待查文本數據的相似度。
9.如權利要求7所述的項目申報數據的查重系統,其特征在于,所述查重系統還包括:
結果輸出模塊,用于輸出查重結果;
所述查重結果包括以下數據的至少一種:
待查重的項目申報數據的總相似度、待查非文本數據的相似度、待查文本數據的相似度、待查重的項目申報數據的字數、待查重的項目申報數據的段落數、待查重的項目申報數據的句子數、句子的平均長度、句子的最大長度、句子的最小長度、句子的相似度分布圖、句子的相似度折線圖、相似資源的信息列表。
10.如權利要求9所述的項目申報數據的查重系統,其特征在于,所述結果輸出模塊還用于根據查重結果并基于FreeMarker技術生成查重報告。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上?;毮茉纯萍加邢挢熑喂荆唇浬虾;毮茉纯萍加邢挢熑喂驹S可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710591752.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據處理方法及裝置
- 下一篇:一種基于情境感知的檔案檢索利用方法及系統





