[發明專利]一種基于多重語義融合的專利價值信息分析方法、裝置在審
| 申請號: | 202011625601.3 | 申請日: | 2020-12-31 |
| 公開(公告)號: | CN112733549A | 公開(公告)日: | 2021-04-30 |
| 發明(設計)人: | 張龍暉;羅瑞祥;楊鋮;張弛;陳龍彪 | 申請(專利權)人: | 廈門智融合科技有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F16/35;G06Q50/18 |
| 代理公司: | 廈門市首創君合專利事務所有限公司 35204 | 代理人: | 李雁翔;王婷婷 |
| 地址: | 361000 福建省廈門市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 多重 語義 融合 專利 價值 信息 分析 方法 裝置 | ||
1.一種基于多重語義融合的專利價值信息分析方法,其特征在于,包括如下步驟:
從專利數據庫中獲取專利的數值信息、文本信息和圖像信息,并將獲取的數值信息、文本信息和圖像信息進行預處理,得到預處理后的數值信息、預處理后的文本信息和預處理后的圖像信息;
將預處理后的文本信息分為文本信息訓練集和文本信息測試集,所述文本信息訓練集輸入語義分類模型Bert中進行訓練,得到訓練好的語義分類模型Bert,將所述文本信息測試集輸入訓練好的語義分類模型Bert,提取文本語義特征;
將預處理后的圖像信息分為圖像信息訓練集和圖像信息測試集,所述圖像信息訓練集輸入圖像分類模型DenseNet中進行訓練,得到訓練好的圖像分類模型DenseNet,將所述圖像信息測試集輸入訓練好的圖像分類模型DenseNet,提取圖像特征;
將預處理后的數值信息作為非結構化數據特征輸入XGBoost分類器,文本語義特征輸入MLP分類器,圖像特征輸入ResNet分類器,分別得出分類結果;
根據三種分類器的分類結果,分析專利價值。
2.根據權利要求1所述的基于多重語義融合的專利價值信息分析方法,其特征在于,所述專利的數值信息包括但不限于:數值信息包括:引用次數、專利權利要求項數、同族引用次數、被引用專利數量、公開年、申請年、5年內被引用次數、3年內被引用次數、簡單同族被引用專利總數、引用專利數量、PatSnap同族被引用專利總數、INPADOC同族被引用專利總數、文獻代碼、受理局、專利類型、簡單法律狀態、IPC主分類號、訴訟案件數、非專利引用文獻數量、當前申請人數量、非專利引用文獻數量、發明人數量、PatSnap同族成員數量、數據庫、簡單同族成員數量、INPADOC同族成員數量;所述專利的文本信息包括但不限于:專利摘要、專利標題;所述專利的圖像信息包括但不限于:專利摘要附圖和專利說明書附圖。
3.根據權利要求1所述的基于多重語義融合的專利價值信息分析方法,其特征在于,所述文本語義特征包括:語義特征。
4.根據權利要求1所述的基于多重語義融合的專利價值信息分析方法,其特征在于,所述圖像特征包括:紋理特征、形狀特征。
5.根據權利要求1所述的基于多重語義融合的專利價值信息分析方法,其特征在于,所述XGBoost分類器、MLP分類器和ResNet分類器的訓練方法為:采用機器學習中半監督學習算法Tri-training。
6.根據權利要求1所述的基于多重語義融合的專利價值信息分析方法,其特征在于,所述根據三種分類器的分類結果,分析專利價值;具體包括:
三種分類器的分類結果均為高,則專利為高價值專利;
三種分類器的分類結果中有一種或兩種分類器的分類結果為高,則專利為中價值專利;
三種分類器的分類結果中均為低,則專利為低價值專利。
7.一種基于多重語義融合的專利價值信息分析裝置,其特征在于,包括:
信息獲取和預處理模塊:用于從專利數據庫中獲取專利的數值信息、文本信息和圖像信息,并將獲取的數值信息、文本信息和圖像信息進行預處理,得到預處理后的數值信息、預處理后的文本信息和預處理后的圖像信息;
文本語義特征提取模塊:用于將預處理后的文本信息分為文本信息訓練集和文本信息測試集,所述文本信息訓練集輸入語義分類模型Bert中進行訓練,得到訓練好的語義分類模型Bert,將所述文本信息測試集輸入訓練好的語義分類模型Bert,提取文本語義特征;
圖像特征提取模塊:用于將預處理后的圖像信息分為圖像信息訓練集和圖像信息測試集,所述圖像信息訓練集輸入圖像分類模型DenseNet中進行訓練,得到訓練好的圖像分類模型DenseNet,將所述圖像信息測試集輸入訓練好的圖像分類模型DenseNet,提取圖像特征;
分類模塊:用于將預處理后的數值信息作為非結構化數據特征輸入XGBoost分類器,文本語義特征輸入MLP分類器,圖像特征輸入ResNet分類器,分別得出分類結果;
價值分析模塊:用于根據三種分類器的分類結果,分析專利價值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門智融合科技有限公司,未經廈門智融合科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011625601.3/1.html,轉載請聲明來源鉆瓜專利網。





