[發明專利]一種文獻檢索及分析系統在審
| 申請號: | 201510804564.5 | 申請日: | 2015-11-20 |
| 公開(公告)號: | CN105354325A | 公開(公告)日: | 2016-02-24 |
| 發明(設計)人: | 劉延淮;孫瑞陽 | 申請(專利權)人: | 上海熠派信息科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京東方靈盾知識產權代理有限公司 11506 | 代理人: | 蘇向銀 |
| 地址: | 201199 上海市閔行區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文獻 檢索 分析 系統 | ||
技術領域
本發明涉及信息檢索領域,具體涉及一種文獻檢索及分析系統。
背景技術
隨著信息技術的迅速發展,電子文件由于其形式多樣、容量大、體積小且便于信息共享和易于復制的優點而正在取代部分傳統紙質出版物。隨之而來的電子文獻檢索已經成為信息獲取的較為有效的途徑。
現今存在的電子文獻檢索方法通常是以統計詞頻的方式為基礎實現的,這類方法都是機械式的進行統計和匹配,忽視了詞語本身在語義上的實際意義和詞語之間在語義上的關聯性,檢索效果并不理想。
同時各企業為了避免在技術推廣應用方面出現不必要的專利糾紛,在進行市場評估時都會進行相應的風險分析。目前,這種方式主要是靠人工進行,即通過人工方式對企業競爭對手在有關國家或地區的專利申請、分析有關專利申請的保護范圍進行分析。與企業相關的專利文獻數量可能非常龐大,同時在對專利文獻進行分析時需要依賴人員的專業知識及工作經驗,人工成本較高,對專利風險評估是較為不利的。
發明內容
本發明的目的在于克服上述現有技術存在的技術缺陷,提供一種新的文獻檢索及分析系統。
本發明的目的是通過以下技術方案實現的:
一方面,本發明提供了一種文獻檢索及分析系統,包括:
基本檢索模塊,用于根據所述搜索請求在結構化數據庫中進行搜索;
拓展檢索模塊,用于根據所述請求結合自然語言處理技術在數據庫中進行搜索;
多數據源集成檢索模塊,用于對專利數據庫的多數據源整合以及用戶的跨庫檢索和多庫檢索等功能;
檢索結果處理模塊,用于對上述模塊檢索到的專利信息根據相關度進行抽取,獲得特定技術領域術語集;
語義庫建設模塊,利用檢索結果處理模塊得到的特定技術領域的術語集并結合關聯分析、專家評估等步驟,構建特定技術領域語義庫,實現對專利的智能檢索功能;
數據挖掘和自然語言處理模塊,用于對檢索到的專利信息數據的深入挖掘和自然語言的進一步處理;
專利信息智能分析結果可視化技術研究模塊,用于對檢索到的專利信息數據進行智能分析與可視化研究;
用戶管理模塊,用于將上述分析得到的數據匯總到用戶管理模塊進行總體管理,并根據用戶需求進行最終端等輸出。
所述多數據源集成檢索模塊包括多技術領域專業詞庫的詞典型搜索和以語義分析為核心的語義網文檔搜索兩種檢索策略;
所述語義庫建設模塊還包括相關度選擇模塊,用于選擇檢索處理模塊得到的特定技術領域術語集中的語義相關的詞條,構建特定技術領域語義庫;
所述用戶管理模塊得到的文獻檢索分析匯總結果,能夠根據用戶需求選擇在計算器終端進行顯示或從終端進行最后的結果輸出。
所述文獻檢索及分析系統中,以數據采集及加工為基礎,從年份、申請人、發明人、關鍵詞等多個專利著錄項的角度出發,對專利數據進行統計、關聯等分析,同時結合可視化技術對分析結果予以展示;可視化作為專利分析的一種手段,將數據挖掘、知識發現等技術綜合運用到整個系統中;并且將信息對象進行綜合、抽象、概念化、知識化、從而更方便簡潔地實現可視化,并進一步發現專利之間地關系以及專利作者的信息等。
與現有技術相比,本發明的優點在于:實現了對專利信息的智能檢索,并在此基礎上對專利數據進行統計、關聯等分析,同時結合可視化技術,對分析結果進行可視化展示。
附圖說明
圖1位本發明文獻檢索及分析系統示意圖。
具體實施方式
為了使本發明的目的、技術方案及優點更加清楚明白,以下結合具體實施例對本發明進一步詳細說明。應當理解,此處所描述的具體實施方式僅僅用以解釋本發明,但并不用于限定本發明。
圖1位本發明文獻檢索及分析系統一個實施例示意圖,如圖1所示,文獻檢索及分析系統包括:
基本檢索模塊101,用于根據所述搜索請求在結構化數據庫中進行搜索。
拓展檢索模塊102,用于根據所述請求結合自然語言處理技術在數據庫中進行搜索。
多數據源集成檢索模塊103,用于對專利數據庫的多數據源整合以及用戶的跨庫檢索和多庫檢索等功能。
檢索結果處理模塊104,用于對專利信息進行抽取,獲得特定技術領域術語集。
語義庫建設模塊105,利用檢索結果處理模塊得到的術語集并結合關聯分析、專家評估等步驟,構建特定技術領域語義庫。
數據挖掘和自然語言處理模塊106,用于數據的深入挖掘和自然語言的進一步處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海熠派信息科技有限公司,未經上海熠派信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510804564.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:疊層聚酯膜
- 下一篇:敷金屬用的聚酰亞胺膜、其制造方法和金屬層疊聚酰亞胺膜





