[發明專利]一種基于知識發現的技術競爭及專利預警分析方法在審
| 申請號: | 201710064192.6 | 申請日: | 2017-02-04 |
| 公開(公告)號: | CN106897392A | 公開(公告)日: | 2017-06-27 |
| 發明(設計)人: | 柳先輝;陳宇飛;王新梅;洪晶;趙衛東 | 申請(專利權)人: | 同濟大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q50/18 |
| 代理公司: | 上海科律專利代理事務所(特殊普通合伙)31290 | 代理人: | 葉鳳 |
| 地址: | 200092 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 知識 發現 技術 競爭 專利 預警 分析 方法 | ||
技術領域
本發明涉及專利信息處理的相關技術領域,具體是一種技術競爭及專利預警分析方法。
背景技術
當今社會處于一個創新型的時代,互聯網日益普及,高新技術發展迅猛。企業如何在激烈的技術競爭環境中保持領先,提升企業的整體創新力水平是關鍵。而在一定意義上,企業的專利水平代表了企業的整體創新力水平。所以企業可以通過對現有的專利進行分析,實現技術競爭以及專利預警。
目前流行的技術競爭及專利預警分析方法,大多采用人工操作,費時費力。基本流程是人工設定檢索式,在數據庫中檢索出所需要的專題數據庫,手工對其進行分析,再將分析結果手動匯總到圖表中。這類方法存在以下缺陷(1)用戶友好性差:對檢索式準確度要求高,檢索式過于精確,檢索到的專利數據少,遺漏度高;檢索式過于寬松,檢索到的專利數據龐大,計算量大,難以實現人工量化分析。(2)分析手段效果差:人工對查找到的專利信息進行統計與技術分析,不但費時費力,而且分析手段落后,未挖掘出專利數據的深層信息。(3)分析結果可視化差:將分析結果手動匯總到圖表,以文字表格的形式,無法對專利信息做出綜合評價。
發明內容
為了解決以上問題,本發明提供一種基于知識發現的智能化專利分析方法,并提供給用戶可視化程度高的分析結果。
本發明一種基于知識發現的技術競爭及專利預警分析方法,簡述為:通過對知識產權數據庫和領域知識的抽取分析,建立專題數據庫,形成相應的數據集,并在此基礎上,利用向量空間、神經網絡、數理統計等數據挖掘和知識發現工具,揭示出蘊含在數據背后的深層信息,并對分析得到的結果進行智能化分析,向用戶提供可視化報表,最終實現專利預警、專利技術熱點和空白點分析、技術生命周期分析。
針對傳統專利分析中,用戶友好性差,對檢索式準確度要求高的問題,本發明在數據挖掘步驟中,提出一種基于改進神經網絡的聚類方法,用戶可以放寬對檢索式的準確度限制。用戶可以設定寬松的檢索式,檢索出大量相關度低的專利文件,對其進行神經網絡聚類建立分類器,再輸入用戶待預警的文件,取出其所在的那一類專利數據做進一步分析。
本發明需要保護的技術方案表征為:一種基于知識發現的技術競爭及專利預警分析方法,其特征在于,具體步驟包括:(1)數據提取階段:根據用戶輸入的檢索式,建立專題數據庫;(2)數據預處理階段:對專題數據庫的專利文本進行預處理,形成特征詞-專利權重矩陣;(3)數據挖掘階段:對形成的專利文本向量,應用SOM神經網絡方法和GMM混合高斯模型相結合的方法進行聚類,得到聚類結果;(4)結果解釋分析階段:對每一類專利文件進行分析,具體包括專利預警、專利技術熱點和空白點分析、或技術生命周期分析,以及它們的綜合運用。
步驟1數據提取階段,建立專題數據庫,對知識產權數據庫和產業領域知識進行抽取分析,得到專利專題數據庫。
步驟2數據預處理階段,其步驟包括:
這里采用的是向量空間模型(VSM),基本思想是將特征詞從專利文件中抽取出來,不考慮專利文件結構和詞序語義。首先提取專利的標題和摘要,再進行中文分詞、詞性標注、合并同義詞、去停用詞(如圖2所示)。專利文件由特征詞組成的一個特征向量表示,記作Vi=(di1,di2,...,dim),其中di1表示第一個特征詞在專利文件i中的權重。對于n個專利文件,形成一個m×n專利特征矩陣D,D=[dij]m×n。由于專利文本和特征詞數量大,而在某個確定的專利文件中出現的特征詞有限,所以這里dij的計算采用TF-IDF方法,其中fij表示第i個特征詞出現在第j個專利文件中的頻度,pi表示含有第i個特征詞的專利文件數量。
步驟3數據挖掘階段:對形成的專利特征矩陣,應用SOM神經網絡方法和GMM混合高斯模型相結合的方法進行聚類,得到聚類結果,聚類得到的專利集合對應著不同主題的專利文件。
步驟3.1對專利向量文本進行SOM自組織學習訓練,得到輸出結點向量集Y。SOM神經網絡方法的優點在于,將高維向量映射為低維向量時保持向量內部拓撲結構不變的特性。在這里,我們使用SOM將高維的專利文本數據映射到二維平面空間。如圖3所示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于同濟大學,未經同濟大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710064192.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:文件存儲方法及裝置
- 下一篇:圖書管理方法及用戶終端





