[發明專利]基于三維視域專利地圖和深度學習的量子行業分析方法在審
| 申請號: | 202210243892.2 | 申請日: | 2022-03-11 |
| 公開(公告)號: | CN114707033A | 公開(公告)日: | 2022-07-05 |
| 發明(設計)人: | 范宣;周瀚閣;趙鳳嬌;田響濤;洪龍偉;吳建新 | 申請(專利權)人: | 中國海洋大學 |
| 主分類號: | G06F16/904 | 分類號: | G06F16/904;G06F16/903;G06F16/906;G06N3/04;G06N3/08;G06N10/00 |
| 代理公司: | 無錫知更鳥知識產權代理事務所(普通合伙) 32468 | 代理人: | 張濤 |
| 地址: | 266100 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 三維 視域 專利 地圖 深度 學習 量子 行業 分析 方法 | ||
1.基于三維視域專利地圖和深度學習的量子行業分析方法,其特征在于,包括如下步驟:
步驟1、對數據集內的數據進行數據處理;
步驟2、將處理后的數據進行可視化分析,繪制專利地圖;
步驟3、將處理后的數據基于深度學習Glove分詞算法和離群值檢測算法進行建模,構建G-LofNet深度神經網絡模型;
步驟4、從時間、空間和模式三個角度出發對國內量子領域的發展進行分析。
2.根據權利要求1所述的基于三維視域專利地圖和深度學習的量子行業分析方法,其特征在于,所述步驟1中進行數據處理的方法為,選取數據集內數據中的特征部分進行分組聚類,并按照多種維度進行統計。
3.根據權利要求2所述的基于三維視域專利地圖和深度學習的量子行業分析方法,其特征在于,所述數據集內數據中的特征部分指時間特征、空間特征、版權與引用特征、文本特征和類別特征,多種維度指時間特征維度、空間特征維度、版權與引用特征維度、文本特征維度和類別特征維度。
4.根據權利要求3所述的基于三維視域專利地圖和深度學習的量子行業分析方法,其特征在于,所述步驟2中處理后的數據進行可視化分析,繪制專利地圖的方法包括:
步驟20、利用Python對時間特征維度、空間特征維度、版權與引用特征維度、文本特征維度和類別特征維度進行預處理;
步驟21、利用JavaScript讀取后進行處理,得到符合Echarts圖標格式的數據;
步驟22、在VSCode的開發環境下,使用插件Live Server呈現可視化用戶界面。
5.根據權利要求3所述的基于三維視域專利地圖和深度學習的量子行業分析方法,其特征在于,所述構建G-LofNet深度神經網絡模型的方法包括如下步驟;
步驟30、將文本特征維度進行分詞處理,并去除文本中的噪聲;
步驟31、基于Glove構建深度神經網絡模型,并獲得詞向量;
步驟32、基于LOF算法進行異常值檢測,對模型進行評估;
步驟33、將異常值可視化后進行分析。
6.根據權利要求5所述的基于三維視域專利地圖和深度學習的量子行業分析方法,其特征在于,所述步驟31中基于Glove構建深度神經網絡模型,并獲得詞向量的方法為,基于Glove算法計算文本關鍵字的詞向量,根據語義計算單詞i與上下文單詞j在特定窗口中出現的次數N,同時計算單詞i和單詞j在窗口中的距離d,以1/d作為權重,根據次數N和權重1/d構建共現矩陣,依據下列公式計算詞向量和共現矩陣之間的近似關系:
其中,和為兩個單詞的偏差項,和為所求的詞向量;
根據上述公式定義損失函數如下:
其中,為權重函數,為非單調遞減的分段函數,控制權重在合理區間,其公式如下:
其中,。
7.根據權利要求6所述的基于三維視域專利地圖和深度學習的量子行業分析方法,其特征在于,所述LOF算法進行異常值檢測的方法為,為每個數據點分配一個基于鄰域密度的離群因子,并和闕值進行比較,判斷是否是離群點。
8.根據權利要求7所述的基于三維視域專利地圖和深度學習的量子行業分析方法,其特征在于,所述LOF算法包括五個組成部分,分別為:第k距離、第k距離鄰域、可達距離、局部可達密度和局部離群因子;
某個點p的第k距離即距離p第k遠的點的距離并且不包括p本身,而點 p 的第 k 距離鄰域 Nk(p), 就是 p 的第 k距離即以內的所有點,包括第 k 距離,而點o到點p的第k可達距離的定義為:
數據點p的局部可達密度為它與鄰近的數據點的平均可達距離的導數,即:
點 p 的局部相對密度(局部異常因子)為點p的鄰居節點的平均局部可達密度跟數據點p的局部可達密度的比值,如下:
。
9.根據權利要求8所述的基于三維視域專利地圖和深度學習的量子行業分析方法,其特征在于,所述LOF算法運用至詞向量的方法為,將每個詞向量看做為公式中的一個點,對于每個向量,計算它到其他向量的距離,并按照從近到遠排序,找到它的第K距離的鄰域向量,計算LOF得分,得到離群詞匯。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國海洋大學,未經中國海洋大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210243892.2/1.html,轉載請聲明來源鉆瓜專利網。





