[發明專利]一種專利技術演化分析方法及系統在審
| 申請號: | 201610087487.0 | 申請日: | 2016-02-16 |
| 公開(公告)號: | CN105677907A | 公開(公告)日: | 2016-06-15 |
| 發明(設計)人: | 林鴻飛;祖坤琳 | 申請(專利權)人: | 大連理工大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q50/18 |
| 代理公司: | 大連星海專利事務所 21208 | 代理人: | 徐雪蓮 |
| 地址: | 116023 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 專利技術 演化 分析 方法 系統 | ||
1.一種專利技術演化分析方法,其特征在于,包括以下步驟:
S1:專利數據采集:
利用網絡爬蟲技術從專利信息網站中采集包含有預設時間區間和關鍵詞的 專利信息數據并保存至本地;
S2、專利信息抽取:包括以下步驟:
A1、創建專利信息數據庫,將步驟S1采集到的專利信息數據進行格式化處 理,存入所述專利信息數據庫;
A2、從專利數據庫中抽取字段信息并將其以文本文件格式保存至本地,并使 每一個專利對應文本中的一行;所述字段信息包括:申請日、專利標題和專利 摘要;
S3、技術發展階段自動化分:包括以下步驟:
B1、建立專利數據的向量空間模型:對步驟S2抽取到的字段信息中的專利 摘要部分進行分詞得到分詞詞語集,將分詞詞語集中的詞語作為特征詞,統計 每個特征詞在多少專利摘要中出現過,以及該特征詞在每個專利摘要中出現的 次數,得到每個特征詞在每個專利中的權重;以每個專利中所包有的特征詞的 個數作為向量維度,而將每個特征詞在該專利中的權重作為向量元素生成每個 專利所對應的專利向量表示;按照字段信息中申請日的時間先后順序,以預設 年度區間為時間區間對所述專利向量進行排序,得到該年度區間專利的向量空 間模型;
B2、使用有序聚類方法自動劃分技術的發展階段:
利用有序聚類方法對向量空間中的向量作為有序樣本進行聚類,將聚類結果 作為技術發展階段,并遞歸計算不同分類結果的類的直徑和誤差函數,根據誤 差函數衡量聚類的性能以確定最佳分類;
S4、技術演化分析:
統計步驟B2得到的每個技術發展階段中所有特征詞的詞頻,得到詞頻最高 的若干個特征詞作為本技術發展階段的技術熱點;
S5技術發展趨勢預測:
利用統計軟件統計專利信息數據庫中每年專利的數量,以年份為橫坐標, 數量為縱坐標,繪制數量變化曲線,并將曲線與標準的技術生命周期曲線對比, 作為技術未來發展趨勢預測結果。
2.根據權利要求1所述的一種專利技術演化分析方法,其特征在于,步驟 A2中,將抽取的字段信息,以“日期/標題/摘要”的文本文件格式存儲到本地。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連理工大學,未經大連理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610087487.0/1.html,轉載請聲明來源鉆瓜專利網。





