[發明專利]一種基于大數據的專利文章整合系統和方法在審
| 申請號: | 201710367316.8 | 申請日: | 2017-05-23 |
| 公開(公告)號: | CN107273432A | 公開(公告)日: | 2017-10-20 |
| 發明(設計)人: | 周鈺徐 | 申請(專利權)人: | 合肥智權信息科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 合肥市長遠專利代理事務所(普通合伙)34119 | 代理人: | 段曉微,葉美琴 |
| 地址: | 230000 安徽省合肥市高新區國家大學*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 數據 專利 文章 整合 系統 方法 | ||
1.一種基于大數據的專利文章整合系統,其特征在于,包括:
數據獲取模塊,用于從網絡大數據的數據庫中下載專利領域的文章,得到專利文章集合Ai;
廣告隱藏模塊,用于隱藏Ai中的廣告信息,得到有效專利文章集合Bi;
數據篩選模塊,用于將Bi中的有效專利文章與本地數據庫中文章進行重合度比較,刪除Bi中有效專利文章的重合度值大于預設閾值的有效專利文章,得到目標專利文章集合Cj,將Cj中目標專利文章存入本地數據庫;
數據檢索模塊,用于向用戶提供本地數據庫檢索界面,并向用戶展示通過檢索條件檢索到的目標專利文章。
2.根據權利要求1所述的基于大數據的專利文章整合系統,其特征在于,所述數據獲取模塊,具體用于:通過互聯網爬蟲從網絡大數據的數據庫中下載專利文章。
3.根據權利要求1所述的基于大數據的專利文章整合系統,其特征在于,所述廣告隱藏模塊,具體用于:
提取Ai中一篇專利文章的句子,得到所述專利文章的句子集合Dm;
將Dm中各句子進行相互間相似度比較,隱藏所述專利文章中相似度低于預設相似度值的句子;
當Ai中所有專利文章均進行相互間相似度比較和隱藏操作后,得到有效專利文章集合Bi。
4.根據權利要求1所述的基于大數據的專利文章整合系統,其特征在于,所述數據篩選模塊,還用于:在將Cj中目標專利文章存入本地數據庫之前,將Cj中各目標專利文章按照文章標題建立索引;和/或,在將Cj中目標專利文章存入本地數據庫之前,將Cj中各目標專利文章按照技術領域建立索引。
5.根據權利要求1所述的基于大數據的專利文章整合系統,其特征在于,還包括任務分配模塊,與數據獲取模塊連接,用于當到達預設時間點時,啟動數據獲取模塊開始工作。
6.一種基于大數據的專利文章整合方法,其特征在于,包括:
S1、從網絡大數據的數據庫中下載專利領域的文章,得到專利文章集合Ai;
S2、隱藏Ai中下載的專利文章中的廣告信息,得到有效專利文章集合Bi;
S3、將Bi中的有效專利文章與本地數據庫中文章進行重合度比較,刪除Bi中有效專利文章的重合度值大于預設閾值的有效專利文章,得到目標專利文章集合Cj,將Cj中目標專利文章存入本地數據庫;
S4、向用戶提供本地數據庫檢索界面,并向用戶展示通過檢索條件檢索到的目標專利文章。
7.根據權利要求6所述的基于大數據的專利文章整合方法,其特征在于,步驟S1,具體包括:通過互聯網爬蟲從網絡大數據的數據庫中下載專利文章。
8.根據權利要求6所述的基于大數據的專利文章整合方法,其特征在于,步驟S2,具體包括:
S21、提取Ai中一篇專利文章的句子,得到所述專利文章的句子集合Dm;
S22、將Dm中各句子進行相互間相似度比較,隱藏所述專利文章中相似度低于預設相似度值的句子;
S23、在Ai中所有專利文章均進行步驟S21、S22操作后,得到有效專利文章集合Bi。
9.根據權利要求6所述的基于大數據的專利文章整合方法,其特征在于,步驟S3中,在將Cj中目標專利文章存入本地數據庫之前,將Cj中各目標專利文章按照文章標題建立索引;和/或,步驟S3中,在將Cj中目標專利文章存入本地數據庫之前,將Cj中各目標專利文章按照技術領域建立索引。
10.根據權利要求6所述的基于大數據的專利文章整合方法,其特征在于,步驟S1,還包括:當到達預設時間點時,從網絡大數據的數據庫中下載專利領域的文章。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥智權信息科技有限公司,未經合肥智權信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710367316.8/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





