[發明專利]一種基于大數據的專利文章整合系統和方法在審
| 申請號: | 201710367316.8 | 申請日: | 2017-05-23 |
| 公開(公告)號: | CN107273432A | 公開(公告)日: | 2017-10-20 |
| 發明(設計)人: | 周鈺徐 | 申請(專利權)人: | 合肥智權信息科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 合肥市長遠專利代理事務所(普通合伙)34119 | 代理人: | 段曉微,葉美琴 |
| 地址: | 230000 安徽省合肥市高新區國家大學*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 數據 專利 文章 整合 系統 方法 | ||
技術領域
本發明涉及數據處理技術領域,尤其涉及一種基于大數據的專利文章整合系統和方法。
背景技術
隨著時代的發展,科技的進步,截至2014年,我國知識產權總體發展狀況在全世界40個主要國家中居第8位,總體實力與世界一流知識產權強國的距離進一步縮小,由此專利領域的技術的文章數據的產出速度變得很快,專利信息已經正式進入大數據時代。但是一般非專利領域的人員在互聯網上搜索專利非常困難,當他們想要進行專利的申請或檢索時卻無從下手,一些檢索平臺網上瀏覽和自主下載會浪費大量的時間,其次,隨著互聯網的發展,文章中總是出現大量廣告、鏈接等無用信息,這給人們閱讀和使用時產生很大的困擾,降低人們的使用體驗。
發明內容
基于背景技術存在的技術問題,本發明提出了一種基于大數據的專利文章整合系統和方法;
本發明提出的一種基于大數據的專利文章整合系統,包括:
數據獲取模塊,用于從網絡大數據的數據庫中下載專利領域的文章,得到專利文章集合Ai;
廣告隱藏模塊,用于隱藏Ai中的廣告信息,得到有效專利文章集合Bi;
數據篩選模塊,用于將Bi中的有效專利文章與本地數據庫中文章進行重合度比較,刪除Bi中有效專利文章的重合度值大于預設閾值的有效專利文章,得到目標專利文章集合Cj,將Cj中目標專利文章存入本地數據庫;
數據檢索模塊,用于向用戶提供本地數據庫檢索界面,并向用戶展示通過檢索條件檢索到的目標專利文章。
優選地,所述數據獲取模塊,具體用于:通過互聯網爬蟲從網絡大數據的數據庫中下載專利文章。
優選地,所述廣告隱藏模塊,具體用于:
提取Ai中一篇專利文章的句子,得到所述專利文章的句子集合Dm;
將Dm中各句子進行相互間相似度比較,隱藏所述專利文章中相似度低于預設相似度值的句子;
當Ai中所有專利文章均進行相互間相似度比較和隱藏操作后,得到有效專利文章集合Bi。
優選地,所述數據篩選模塊,還用于:在將Cj中目標專利文章存入本地數據庫之前,將Cj中各目標專利文章按照文章標題建立索引;和/或,在將Cj中目標專利文章存入本地數據庫之前,將Cj中各目標專利文章按照技術領域建立索引。
優選地,還包括任務分配模塊,與數據獲取模塊連接,用于當到達預設時間點時,啟動數據獲取模塊開始工作。
一種基于大數據的專利文章整合方法,包括:
S1、從網絡大數據的數據庫中下載專利領域的文章,得到專利文章集合Ai;
S2、隱藏Ai中下載的專利文章中的廣告信息,得到有效專利文章集合Bi;
S3、將Bi中的有效專利文章與本地數據庫中文章進行重合度比較,刪除Bi中有效專利文章的重合度值大于預設閾值的有效專利文章,得到目標專利文章集合Cj,將Cj中目標專利文章存入本地數據庫;
S4、向用戶提供本地數據庫檢索界面,并向用戶展示通過檢索條件檢索到的目標專利文章。
優選地,步驟S1,具體包括:通過互聯網爬蟲從網絡大數據的數據庫中下載專利文章。
優選地,步驟S2,具體包括:
S21、提取Ai中一篇專利文章的句子,得到所述專利文章的句子集合Dm;
S22、將Dm中各句子進行相互間相似度比較,隱藏所述專利文章中相似度低于預設相似度值的句子;
S23、在Ai中所有專利文章均進行步驟S21、S22操作后,得到有效專利文章集合Bi。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥智權信息科技有限公司,未經合肥智權信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710367316.8/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





