[發明專利]中文工藝專利自動分類系統及利用該系統進行專利分類的方法有效
| 申請號: | 201410441093.1 | 申請日: | 2014-09-01 |
| 公開(公告)號: | CN104216979B | 公開(公告)日: | 2017-12-05 |
| 發明(設計)人: | 耿俊浩;劉永剛;王剛鋒 | 申請(專利權)人: | 西北工業大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 西北工業大學專利中心61204 | 代理人: | 王鮮凱 |
| 地址: | 710072 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 中文 工藝 專利 自動 分類 系統 利用 進行 方法 | ||
1.一種中文工藝專利自動分類系統,其特征在于包括客戶端計算機、應用服務器和數據庫;客戶端計算機有多臺,多臺客戶端計算機分別通過網絡與應用服務器連接,應用服務器通過數據線與數據庫連接;客戶端計算機用于分類參數設置、類別標注設置以及查看分類結果;應用服務器包括專利獲取模塊、靜態匹配模塊和動態聚類模塊;其中,專利獲取模塊用于獲取一篇專利文獻的標題和摘要;靜態匹配模塊用于分類詞庫匹配查找專利的標題或摘要來進行初步分類;動態聚類模塊包括中文分詞功能、詞性標注功能、去除停用詞功能、詞頻統計功能、特征詞提取功能、聚類處理功能和類別標注功能;動態聚類模塊用于對靜態匹配剩余的專利集進行分類處理;數據庫用于存儲專利信息和存儲分類結果。
2.一種利用權利要求1所述中文工藝專利自動分類系統進行專利分類的方法,其特征在于包括以下步驟:
步驟一、以工藝方法為中心,結合制造對象和制造特征,將工藝專利按照兩種方式進行分類;一種是工藝方法和制造對象;另一種是工藝方法和制造特征;
步驟二、用工藝領域分類詞匯庫靜態匹配查找工藝專利集,
1)領域專家集體歸納構建工藝領域分類詞匯庫;
2)將工藝專利集的標題或摘要與分類詞匯庫相匹配,直接匹配到分類詞的專利集即歸屬到此類別下;
步驟三、對未匹配到的工藝專利集進行動態聚類,最后進行類別標注并加入到分類詞匯庫中,
1)獲取靜態匹配剩余專利的標題和摘要;
2)對工藝專利進行分詞、詞性標注和去停用詞預處理;
3)對每個工藝專利的標題和摘要進行詞頻統計和特征詞提取,包括三部分:制造對象、工藝方法和制造特征,三個部分作為專利的特征,每個部分均從專利中提取出關鍵詞來代表專利的類別;
4)進行聚類處理,對專利集三類關鍵詞組分別進行聚類,將專利分到的類別進行標記、統計;
5)對聚類的結果進行類別標注并加入到分類詞匯庫中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北工業大學,未經西北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410441093.1/1.html,轉載請聲明來源鉆瓜專利網。





