[發明專利]一種物聯網平臺文檔數據的管理方法及裝置在審
| 申請號: | 201910900938.1 | 申請日: | 2019-09-23 |
| 公開(公告)號: | CN110647584A | 公開(公告)日: | 2020-01-03 |
| 發明(設計)人: | 張曉霞;曲文武;胡偉鳳;紀旭升 | 申請(專利權)人: | 青島聚好聯科技有限公司 |
| 主分類號: | G06F16/27 | 分類號: | G06F16/27;G06F16/215;G06F16/242 |
| 代理公司: | 11291 北京同達信恒知識產權代理有限公司 | 代理人: | 張懷陽 |
| 地址: | 266101 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 廠商信息 設備信息 文檔 文檔數據 文檔信息 對設備 管理方法及裝置 預處理 數據解析結果 數據預處理 物聯網平臺 基礎信息 客服系統 數據解析 文檔管理 用戶上傳 用戶提供 用戶知識 知識問答 定制化 實體類 解析 數據庫 存儲 智能 客戶 服務 | ||
1.一種物聯網平臺文檔數據的管理方法,其特征在于,包括:
獲取用戶上傳的文檔信息,所述文檔信息包括設備信息、廠商信息和設備相關文檔;
對所述設備相關文檔進行數據預處理;
根據所述設備信息和所述廠商信息,對預處理后的所述設備相關文檔進行多個實體類的數據解析,并將數據解析結果存儲到數據庫中。
2.如權利要求1所述的方法,其特征在于,所述對所述設備相關文檔進行數據預處理,包括:
對所述設備相關文檔進行數據清洗,所述數據清洗包括去除空白行、去除不能識別的文本、保留標題信息、保留段落信息和規整化數據存儲。
3.如權利要求1所述的方法,其特征在于,所述根據所述設備信息和所述廠商信息,對預處理后的所述設備相關文檔進行多個實體類的數據解析,包括:
對于文檔類數據,根據所述設備信息和所述廠商信息、獲取文檔信息的時間生成文檔ID,并根據所述預處理后的所述設備相關文檔,生成所述文檔ID對應的文檔摘要;
對于段落類數據,根據所述文檔ID和段落在所述設備相關文檔中的位置確定段落ID,并生成所述段落ID對應的段落摘要以及段落關鍵詞;
對于句子類數據,根據所述段落ID和句子在其所在段落中的位置,確定句子ID,并生成所述句子ID對應的句子關鍵詞;
對于詞類數據,詞在其所在句子的順序,生成詞ID,并生成詞ID對應的詞性。
4.如權利要求1至3任一項所述的方法,其特征在于,所述數據解析結果用于文檔檢索、文檔查詢或知識問答。
5.一種物聯網平臺文檔數據的管理裝置,其特征在于,包括:
獲取單元,用于獲取用戶上傳的文檔信息,所述文檔信息包括設備信息、廠商信息和設備相關文檔;
處理單元,用于對所述設備相關文檔進行數據預處理;根據所述設備信息和所述廠商信息,對預處理后的所述設備相關文檔進行多個實體類的數據解析,并將數據解析結果存儲到數據庫中。
6.如權利要求5所述的裝置,其特征在于,所述處理單元具體用于:
對所述設備相關文檔進行數據清洗,所述數據清洗包括去除空白行、去除不能識別的文本、保留標題信息、保留段落信息和規整化數據存儲。
7.如權利要求5所述的裝置,其特征在于,所述處理單元具體用于:
對于文檔類數據,根據所述設備信息和所述廠商信息、獲取文檔信息的時間生成文檔ID,并根據所述預處理后的所述設備相關文檔,生成所述文檔ID對應的文檔摘要;
對于段落類數據,根據所述文檔ID和段落在所述設備相關文檔中的位置確定段落ID,并生成所述段落ID對應的段落摘要以及段落關鍵詞;
對于句子類數據,根據所述段落ID和句子在其所在段落中的位置,確定句子ID,并生成所述句子ID對應的句子關鍵詞;
對于詞類數據,詞在其所在句子的順序,生成詞ID,并生成詞ID對應的詞性。
8.如權利要求5至7任一項所述的裝置,其特征在于,所述數據解析結果用于文檔檢索、文檔查詢或知識問答。
9.一種計算設備,其特征在于,包括:
存儲器,用于存儲程序指令;
處理器,用于調用所述存儲器中存儲的程序指令,按照獲得的程序執行權利要求1至4任一項所述的方法。
10.一種計算機可讀非易失性存儲介質,其特征在于,包括計算機可讀指令,當計算機讀取并執行所述計算機可讀指令時,使得計算機執行如權利要求1至4任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于青島聚好聯科技有限公司,未經青島聚好聯科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910900938.1/1.html,轉載請聲明來源鉆瓜專利網。





