[發(fā)明專利]一種情報數據融合方法與裝置有效
| 申請?zhí)枺?/td> | 202110588184.8 | 申請日: | 2021-05-27 |
| 公開(公告)號: | CN113254641B | 公開(公告)日: | 2021-11-16 |
| 發(fā)明(設計)人: | 任傳倫;王淮;劉曉影;烏吉斯古愣;俞賽賽;張先國;王玥 | 申請(專利權)人: | 中國電子科技集團公司第十五研究所;中國電子科技集團公司第三十研究所 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/295;G06K9/62 |
| 代理公司: | 北京豐浩知識產權代理事務所(普通合伙) 11781 | 代理人: | 李學康 |
| 地址: | 100083 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 情報 數據 融合 方法 裝置 | ||
1.一種情報數據融合方法,其特征在于,包括:
S1對原始網絡情報數據進行預處理,獲得符合情報庫數據模型的結構化數據;
S2采集大量所述結構化數據并對其中每一條數據進行融合方式的標注,形成訓練數據;使用訓練數據對決策樹模型進行機器學習訓練,獲得Smart規(guī)則決策樹模型;所述使用訓練數據對決策樹模型進行機器學習訓練具體為使用決策樹ID3分類算法進行訓練;所述訓練具體為對所述結構化數據的實體類型、實體屬性進行訓練,約束為標注的所述結構化數據的融合方式;通過所述Smart規(guī)則包括實體融合規(guī)則和實體屬性融合規(guī)則,所述實體融合規(guī)則包括實體的數據覆蓋寫入、數據新增寫入、重復數據丟棄融合規(guī)則;所述實體屬性融合規(guī)則包括實體屬性的數據覆蓋寫入、數據新增寫入、重復數據丟棄、數據追加寫入、部分替換寫入;
S3將所述結構化數據輸入Smart規(guī)則決策樹模型,獲取所述結構化數據與所述情報庫數據模型的Smart規(guī)則;
S4根據所述Smart規(guī)則將所述結構化數據寫入所述情報庫。
2.根據權利要求1所述的一種情報數據融合方法,其特征在于,所述預處理包括:
S101實體提?。簩λ鲈季W絡情報數據中的情報實體進行識別,及提取和保存實體字段;
S102實體分類:對所述情報實體進行分類,根據所述情報庫數據模型的約束將所述實體字段映射到所述情報庫數據模型上;
S103屬性識別:識別所述情報實體的實體屬性;
S104屬性提取:將所述實體屬性與所述情報庫數據模型進行匹配,對匹配吻合的所述實體屬性進行屬性值的提取和處理,形成格式化的實體屬性數據。
3.根據權利要求2所述的一種情報數據融合方法,其特征在于,所述訓練數據具體為:
定義m類所述情報實體,定義n類所述情報實體的實體屬性;
對每一條所述原始網絡情報數據進行預處理,形成所述結構化數據為m+n維數據向量;
所述融合方式的標注分為對所述情報實體融合方式的標注以及對所述實體屬性融合方式的標注;
所述情報實體融合方式為數據覆蓋寫入、數據新增寫入和重復數據丟棄;
所述實體屬性融合方式為數據覆蓋寫入、數據新增寫入、重復數據丟棄、數據追加寫入和部分替換寫入。
4.根據權利要求3所述的一種情報數據融合方法,其特征在于,所述使用決策樹ID3分類算法進行訓練具體為:
步驟一:對所述訓練數據計算獲取當前信息熵,計算各所述n個實體屬性下的分支信息熵,根據所述分支信息熵計算條件熵,進而分別計算n個屬性的信息增益,從中選擇所述信息增益最大的屬性作為決策點并加入決策樹;
步驟二:將所述信息增益最大的屬性列數據從所述訓練數據中移除,對當前訓練數據重復步驟一,直至全部實體屬性均加入決策樹。
5.一種情報數據融合裝置,其特征在于,包括:
預處理模塊:被配置為對原始網絡情報數據進行預處理,獲得符合情報庫數據模型的結構化數據;
模型訓練模塊:被配置為采集大量所述結構化數據并對其中每一條數據進行融合方式的標注,形成訓練數據;使用訓練數據對決策樹模型進行機器學習訓練,獲得Smart規(guī)則決策樹模型;所述使用訓練數據對決策樹模型進行機器學習訓練具體為使用決策樹ID3分類算法進行訓練;所述訓練具體為對所述結構化數據的實體類型、實體屬性進行訓練,約束為標注的所述結構化數據的融合方式;通過所述Smart規(guī)則包括實體融合規(guī)則和實體屬性融合規(guī)則,所述實體融合規(guī)則包括實體的數據覆蓋寫入、數據新增寫入、重復數據丟棄融合規(guī)則;所述實體屬性融合規(guī)則包括實體屬性的數據覆蓋寫入、數據新增寫入、重復數據丟棄、數據追加寫入、部分替換寫入;
生成融合規(guī)則模塊:被配置為將所述結構化數據輸入Smart規(guī)則決策樹模型,獲取所述結構化數據與所述情報庫數據模型的Smart規(guī)則;
數據寫入模塊:被配置為根據所述Smart規(guī)則將所述結構化數據寫入所述情報庫。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國電子科技集團公司第十五研究所;中國電子科技集團公司第三十研究所,未經中國電子科技集團公司第十五研究所;中國電子科技集團公司第三十研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110588184.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種油氣模塊工藝管線焊縫的信息管理方法
- 下一篇:一種手持一體式水槍
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發(fā)送方法、數據發(fā)送系統、數據發(fā)送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發(fā)送和數據接收設備、數據發(fā)送和數據接收方法
- 數據發(fā)送裝置、數據接收裝置、數據收發(fā)系統、數據發(fā)送方法、數據接收方法和數據收發(fā)方法
- 數據發(fā)送方法、數據再現方法、數據發(fā)送裝置及數據再現裝置
- 數據發(fā)送方法、數據再現方法、數據發(fā)送裝置及數據再現裝置





