[發明專利]一種文獻入庫的判斷方法和裝置在審
| 申請號: | 201811085453.3 | 申請日: | 2018-09-18 |
| 公開(公告)號: | CN109344400A | 公開(公告)日: | 2019-02-15 |
| 發明(設計)人: | 鄧梅;宋國華;黃家旺 | 申請(專利權)人: | 江蘇潤桐數據服務有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/22;G06F16/33 |
| 代理公司: | 蘇州潤桐嘉業知識產權代理有限公司 32261 | 代理人: | 高遠 |
| 地址: | 215600 江蘇省蘇州市張家港市楊*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文檔 目標檢索 相似度 方法和裝置 檢索數據庫 目標數據庫 技術工具 檢索結果 比對 入庫 文檔相似度 技術效果 檢索比對 文檔獲得 文獻內容 預定條件 檢索 | ||
1.一種文獻入庫的判斷方法,其特征在于,所述方法包括:
根據目標檢索文檔的第一關鍵詞,獲得第一檢索數據庫;
根據目標檢索文檔,獲得所述目標檢索文檔所處的技術領域;
根據所述技術領域獲得技術工具詞典;
根據所述技術工具詞典和第一關鍵詞獲得第一擴展詞;
根據所述目標檢索文檔、第一關鍵詞和第一擴展詞獲得第一比對文檔;
根據所述第一檢索數據庫獲得第一文獻;
判斷所述第一文獻和第一比對文檔的相似度;
當所述相似度滿足第一預定條件時,將所述第一文獻存入目標數據庫。
2.如權利要求1所述的方法,其特征在于,所述根據所述技術工具詞典和第一關鍵詞獲得第一擴展詞,包括:
從所述技術工具詞典中獲得N個類似詞;
將N個類似詞進行語義分析,獲得M個擴展詞;
按照重復度獲得第一擴展詞。
3.如權利要求1所述的方法,其特征在于,所述第一擴展詞和所述第一關鍵詞為類似詞。
4.如權利要求1所述的方法,其特征在于,所述判斷所述第一文獻和第一比對文檔的相似度,包括:
將所述第一文獻進行語義分析,獲得N個第一關鍵詞,其中N為正整數;
將第一比對文檔進行語義分析,獲得M個第二關鍵詞,其中M為正整數;
判斷N個第一關鍵詞與M個第二關鍵詞的第一相似度。
5.如權利要求1所述的方法,其特征在于,所述判斷所述第一文獻和第一比對文檔的相似度之后,包括:
當所述相似度不滿足第一預定條件時,將所述第一文獻從所述目標數據庫中刪除。
6.如權利要求1所述的方法,其特征在于,所述方法還包括:
根據所述第一檢索數據庫中獲得第二文獻;
判斷所述第二文獻與和第一比對文檔的相似度;
當所述相似度滿足第一預定條件時,將所述第二文獻存入目標數據庫。
7.一種文獻入庫的判斷裝置,其特征在于,所述裝置包括:
第一獲得單元,所述第一獲得單元用于根據目標檢索文檔的第一關鍵詞,獲得第一檢索數據庫;
第二獲得單元,所述第二獲得單元用于根據目標檢索文檔,獲得所述目標檢索文檔所處的技術領域;
第三獲得單元,所述第三獲得單元用于根據所述技術領域獲得技術工具詞典;
第四獲得單元,所述第四獲得單元用于根據所述技術工具詞典和第一關鍵詞獲得第一擴展詞;
第五獲得單元,所述第五獲得單元用于根據所述目標檢索文檔、第一關鍵詞和第一擴展詞獲得第一比對文檔;
第六獲得單元,所述第六獲得單元用于根據所述第一檢索數據庫獲得第一文獻;
第一判斷單元,所述第一判斷單元用于判斷所述第一文獻和第一比對文檔的相似度;
第一執行單元,所述第一執行單元用于當所述相似度滿足第一預定條件時,將所述第一文獻存入目標數據庫。
8.一種文獻入庫的判斷裝置,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序時實現以下步驟:
根據目標檢索文檔的第一關鍵詞,獲得第一檢索數據庫;
根據目標檢索文檔,獲得所述目標檢索文檔所處的技術領域;
根據所述技術領域獲得技術工具詞典;
根據所述技術工具詞典和第一關鍵詞獲得第一擴展詞;
根據所述目標檢索文檔、第一關鍵詞和第一擴展詞獲得第一比對文檔;
根據所述第一檢索數據庫獲得第一文獻;
判斷所述第一文獻和第一比對文檔的相似度;
當所述相似度滿足第一預定條件時,將所述第一文獻存入目標數據庫。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇潤桐數據服務有限公司,未經江蘇潤桐數據服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811085453.3/1.html,轉載請聲明來源鉆瓜專利網。





