[發明專利]一種基于SOINN網絡的在線物聯網設備識別方法在審
| 申請號: | 202110781214.7 | 申請日: | 2021-07-10 |
| 公開(公告)號: | CN113657443A | 公開(公告)日: | 2021-11-16 |
| 發明(設計)人: | 黃杰;張帥帥 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G16Y30/00 |
| 代理公司: | 南京眾聯專利代理有限公司 32206 | 代理人: | 杜靜靜 |
| 地址: | 210096 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 soinn 網絡 在線 聯網 設備 識別 方法 | ||
本發明公開了一種基于SOINN網絡的在線物聯網設備識別方法,包括四個步驟:結構化特征提取、非結構化特征提取、設備品牌識別和設備型號識別。特征提取步驟中,先分析設備交互頁面DOM樹結構,結合局部敏感哈希函數提取設備結構化特征。采用正則匹配從文本數據中尋找型號關鍵詞,利用TF?IDF賦予關鍵詞權重值,關鍵詞及其權重值組成非結構化特征。設備品牌識別中,首先利用經SOINN網絡壓縮的數據訓練SVM分類器,訓練好的分類模型用于設備品牌分類。在型號識別中,結合Jaro距離計算待識別設備與型號特征庫距離,實現設備型號分類。本發明設計了物聯網設備結構化與非結構化特征,對具有用戶交互頁面的物聯網設備具有較高的識別率,并支持品牌和型號的細粒度識別。
技術領域
本發明屬于物聯網設備識別技術領域,特別是一種基于SOINN網絡的在線物聯網設備識別方法。
背景技術
隨著物聯網的快速發展,大量新的物聯網設備被投入使用。但物聯網設備結構簡單,缺乏安全防護,存在嚴重的安全問題。公網上暴露了數以萬計的物聯網設備,成為了黑客攻擊和入侵的主要目標,導致了諸如DDOS攻擊、隱私泄露等網絡安全問題。利用物聯網設備識別技術及時發現和識別設備,進行安全漏洞的修補和維護,是物聯網安全管理中非常有效的手段。
目前物聯網設備識別技術大致可以分為兩類:基于分類模型的設備識別方法和基于標語信息的設備識別方法。基于分類模型的設備識別方法需要先提取數字化特征,然后結合機器學習方法訓練分類模型實現設備分類。等利用半監督學習方法對設備的特征進行分簇,可以識別少量的物聯網設備操作系統。Thangavelu等通過采集設備在一段時間內的流量,分析和提取流量特征,訓練了具有高識別率的設備分類器。Marchal等利用傅里葉分析提取設備流量在時頻上的特征指紋,并結合無監督學習方法對物聯網設備的定期通信流量進行建模,最終達到了98.2%的識別準確率。基于標語信息的設備識別方法專注于從設備的文本數據中直接提取設備品牌和型號信息。XuanFeng等提出了ARE設備識別引擎,可以基于文本規則自我學習,發現新的設備并自動生成設備指紋。Qiang等利用卡方檢驗方法從文本數據中篩選關鍵字構成設備指紋,可以識別出在線監控設備。
從上述介紹可知,國內外研究人員在物聯網設備識別領域已經取得很多進展,各類識別方法都有較高的識別準確率。但上述方法依然存在許多亟待解決的問題。一方面,物聯網設備更新較快,基于監督學習方法的分類模型無法動態更新;另一方面,當品牌型號等關鍵字缺失或無法提取時,基于標語的識別方法效果就會很差。因此,本發明采用多種設備特征實現設備分類,并結合增量學習方法使得分類模型可以在線學習,很好的解決了以上問題。
發明內容
本發明的目的在于針對傳統設備識別方法中存在的模型動態更新困難、計算存儲開銷大和關鍵字缺失等問題,提供了一種基于SOINN網絡的在線物聯網設備識別方法。該方案結合自組織增量學習網絡SOINN實現了分類模型的動態更新,可以在識別過程中提升設備識別準確率,更加適應變化快速的物聯網環境。
為了實現上述目的,采用如下技術方案:
一種基于SOINN網絡的在線物聯網設備識別方法,包括下述步驟:
(1)結構化特征提取:
1.1從數據庫中獲取設備的交互頁面代碼;
1.2設置結構化特征F初始值,長度為256,每一位為0。依次順序遍歷HTML代碼的每一層,提取每層包含的HTML節點標簽,記為:t1,t2,…tn;
1.3對每一層標簽進行如下處理:
1.3.1利用該層標簽產生所有三元組全排列組合,記為C1,C2,…,Cm;
1.3.2利用md5哈希算法計算每個Ci的哈希值,并求該哈希值除以256的余數,記為h。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110781214.7/2.html,轉載請聲明來源鉆瓜專利網。





