[發明專利]物聯網設備的檢索方法有效
| 申請號: | 201710252328.6 | 申請日: | 2017-04-18 |
| 公開(公告)號: | CN107205016B | 公開(公告)日: | 2020-01-21 |
| 發明(設計)人: | 李勐;陳海明;崔莉 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | H04L29/08 | 分類號: | H04L29/08 |
| 代理公司: | 11280 北京泛華偉業知識產權代理有限公司 | 代理人: | 王勇 |
| 地址: | 100190 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聯網 設備 檢索 方法 | ||
1.一種在服務器端進行的物聯網設備的檢索方法,包括以下步驟:
步驟1:爬取物聯網設備信息;
步驟2:對每個所述物聯網設備信息中的數據序列提取特征,對于物聯網設備信息中文本描述缺失的設備,以其數據序列的特征作為輸入,利用訓練好的分類器獲得其對應的分類標簽,進而獲得其分類描述,利用網絡流模型來計算反映所述分類描述合理性的得分,以獲得優化的分類描述,其中:
所述分類器通過訓練而獲得,包括:對于物聯網設備信息中文本描述完整的設備,將其歸類為預設的分類標簽,以其數據序列的特征作為輸入,以其對應的分類標簽作為輸出來訓練分類器;
所述網絡流模型通過下述方式獲得:統計不同物聯網應用中不同類別設備的配比信息,基于所述配比信息通過聚類算法獲得所述物聯網設備歸屬的物聯網應用類型,通過對所述物聯網應用類型建立網絡流模型;
步驟3:基于所述分類描述生成檢索索引,以用于匹配待檢索的物聯網設備。
2.根據權利要求1所述的方法,其中,所述分類標簽采用“部署位置-采集目標-采集變量類型”的形式進行標注。
3.根據權利要求1所述的方法,其中,在對所述分類描述進行優化時采用以下公式來計算所述得分:
其中,n表示需要進行分類指派的物聯網設備的數目,i為其中第i個設備,m為所有設備的類型數目,j為其中第j個類型,p(tj|si)表示設備si屬于物聯網設備類型tj的概率,取值為0或1,取值為1時表示設備si屬于類型tj,表示在該物聯網應用中,所有屬于類型tj的設備的數量。
4.根據權利要求1所述的方法,其中,所述數據序列的特征包括均值、最大值、最小值、數值方差、數據序列的小波系數、跨零次數、一階線性回歸系數、取窗口后的序列均值中的至少一項。
5.根據權利要求1所述的方法,其中,步驟3包括:
基于所述物聯網設備的分類描述計算詞袋模型;
以所述詞袋模型和所述物聯網設備信息中的屬性信息為輸入,通過訓練DMR模型獲得所述物聯網設備的主題向量索引;
基于所述物聯網設備的分類描述獲得全文索引。
6.根據權利要求5所述的方法,其中,步驟3還包括:
在接收到待檢索的設備的文本內容之后,基于所述全文索引和所述主題向量索引計算反映各個設備與待檢索設備的匹配程度的打分值;基于所述打分值輸出檢索到的物聯網設備。
7.根據權利要求6所述的方法,其中,所述打分值是基于全文索引計算的打分值和基于主題向量計算的打分值的加權。
8.根據權利要求1至7中任一項所述的方法,其中,所述分類器是隨機森林。
9.一種計算機可讀存儲介質,其上存儲有計算機程序,其中,該程序被處理器執行時實現根據權利要求1至8中任一項所述的步驟。
10.一種計算機設備,包括存儲器、處理器以及存儲在存儲器上能夠在處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序時實現權利要求1至8中任一項所述的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710252328.6/1.html,轉載請聲明來源鉆瓜專利網。





