[發明專利]頁面處理方法、裝置、設備及存儲介質有效
| 申請號: | 201910046110.4 | 申請日: | 2019-01-17 |
| 公開(公告)號: | CN109710224B | 公開(公告)日: | 2022-06-14 |
| 發明(設計)人: | 宜博;黃江濤 | 申請(專利權)人: | 宜創(北京)科技有限公司 |
| 主分類號: | G06F8/20 | 分類號: | G06F8/20;G06F8/30 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 王術蘭 |
| 地址: | 100000 北京市海淀區成*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 頁面 處理 方法 裝置 設備 存儲 介質 | ||
1.一種頁面處理方法,其特征在于,包括:
爬取目標頁面,其中爬取目標頁面是根據用戶輸入的參數來爬取的,所述用戶輸入的參數包括網絡協議地址、頁面的名稱或者類型;
獲取所述目標頁面中的目標數據;
將所述目標數據轉換為目標格式的多個數據單元;
根據多個所述數據單元生成新頁面,其中所述根據多個所述數據單元生成新頁面包括:獲取用戶輸入的配置參數;從多個所述數據單元中確定與所述配置參數所匹配的待配置數據單元;根據所述配置參數配置所述待配置數據單元,得到配置數據單元;根據所述配置數據單元和未配置的數據單元生成新頁面。
2.根據權利要求1所述的方法,其特征在于,所述獲取所述目標頁面中的目標數據,包括:
提取所述目標頁面所對應的頁面布局信息;
根據所述頁面布局信息從所述目標頁面中確定出目標數據。
3.根據權利要求2所述的方法,其特征在于,所述提取所述目標頁面所對應的頁面布局信息,包括:
提取所述目標頁面所對應的頁面結構和頁面樣式;
將所述頁面結構和所述頁面樣式作為頁面布局信息。
4.根據權利要求2所述的方法,其特征在于,所述根據所述頁面布局信息從所述目標頁面中確定出目標數據,包括:
根據所述頁面布局信息提取所述頁面中的頁面元素;
提取所述頁面元素所對應的頁面數據;
過濾所述頁面數據中與預設參數匹配的數據,得到目標數據。
5.根據權利要求1所述的方法,其特征在于,所述將所述目標數據轉換為目標格式的多個數據單元,包括:
將所述目標數據按照頁面標簽屬性拆分為目標格式的多個數據單元。
6.一種頁面處理裝置,其特征在于,包括:
頁面爬取單元,用于爬取目標頁面,其中爬取目標頁面是根據用戶輸入的參數來爬取的,所述用戶輸入的參數包括網絡協議地址、頁面的名稱或者類型;
數據獲取單元,用于獲取所述目標頁面中的目標數據;
數據處理單元,用于將所述目標數據轉換為目標格式的多個數據單元;
頁面生成單元,用于根據多個所述數據單元生成新頁面,其中所述根據多個所述數據單元生成新頁面包括:獲取用戶輸入的配置參數;從多個所述數據單元中確定與所述配置參數所匹配的待配置數據單元;根據所述配置參數配置所述待配置數據單元,得到配置數據單元;根據所述配置數據單元和未配置的數據單元生成新頁面。
7.根據權利要求6所述的裝置,其特征在于,所述數據獲取單元還用于:
提取所述目標頁面所對應的頁面布局信息;
根據所述頁面布局信息從所述目標頁面中確定出目標數據。
8.一種終端設備,其特征在于,包括:存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現如權利要求1至5任一項所述的頁面處理方法的步驟。
9.一種存儲介質,其特征在于,所述存儲介質用于存儲指令,當所述指令在計算機上運行時,使得所述計算機執行如權利要求1至5任一項所述的頁面處理方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于宜創(北京)科技有限公司,未經宜創(北京)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910046110.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于分布式KV存儲系統的API網關熱插拔系統
- 下一篇:程序語言編輯方法





