[發明專利]網頁標記語言的轉換方法及裝置在審
| 申請號: | 201810539556.6 | 申請日: | 2018-05-30 |
| 公開(公告)號: | CN108829648A | 公開(公告)日: | 2018-11-16 |
| 發明(設計)人: | 李雅男 | 申請(專利權)人: | 北京小度信息科技有限公司 |
| 主分類號: | G06F17/22 | 分類號: | G06F17/22 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郝傳鑫 |
| 地址: | 100085 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網頁標記 主體內容 頁面 轉換方法及裝置 語言 字符串 標簽 標簽轉換 開發效率 頁面文件 應用開發 網頁 轉換 | ||
1.一種網頁標記語言的轉換方法,其特征在于,所述方法包括:
從基于第一網頁標記語言的頁面文件中提取頁面主體內容;
將所述頁面主體內容轉換為字符串;
基于所述字符串以及標簽對應關系,將所述頁面主體內容中的標簽轉換為基于第二網頁標記語言的標簽。
2.如權利要求1所述的方法,其特征在于,所述從基于第一網頁標記語言的頁面文件中提取頁面主體內容,包括:
利用正則表達式從基于超文本標記語言的頁面文件中提取主體標簽及其內容。
3.如權利要求1所述的方法,其特征在于,所述將所述頁面主體內容轉換為字符串,包括:
刪除所述頁面主體內容中的格式信息,得到所述字符串。
4.如權利要求1至3中任一項所述的方法,其特征在于,所述基于所述字符串以及標簽對應關系,將所述頁面主體內容中的標簽轉換為基于第二網頁標記語言的標簽,包括:
利用正則表達式查找所述字符串中的基于第一網頁標記語言的標簽;
基于所述標簽對應關系,將所述頁面主體內容中的基于第一網頁標記語言的標簽替換為基于第二網頁標記語言的標簽。
5.一種網頁標記語言的轉換裝置,其特征在于,所述裝置包括:
提取模塊,用于從基于第一網頁標記語言的頁面文件中提取頁面主體內容;
優化模塊,用于將所述頁面主體內容轉換為字符串;
轉換模塊,用于基于所述字符串以及標簽對應關系,將所述頁面主體內容中的標簽轉換為基于第二網頁標記語言的標簽。
6.如權利要求5所述的裝置,其特征在于,
所述提取模塊具體用于利用正則表達式從基于超文本標記語言的頁面文件中提取主體標簽及其內容。
7.如權利要求5所述的裝置,其特征在于,
所述優化模塊具體用于刪除所述頁面主體內容中的格式信息,得到所述字符串。
8.如權利要求5-7中任一項所述的裝置,其特征在于,所述轉換模塊包括:
查找子模塊,用于利用正則表達式查找所述字符串中的基于第一網頁標記語言的標簽;
替換子模塊,用于基于所述標簽對應關系,將所述頁面主體內容中的基于第一網頁標記語言的標簽替換為基于第二網頁標記語言的標簽。
9.一種電子設備,包括存儲器和處理器,其特征在于,
所述存儲器用于存儲一條或多條計算機指令;
所述處理器用于調用并執行所述一條或多條計算機指令,從而實現如權利要求1-4中任一項所述的方法。
10.一種計算機存儲介質,其特征在于,
所述計算機存儲介質存儲有一條或多條計算機指令,所述一條或多條計算機指令被執行時實現如權利要求1-4中任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京小度信息科技有限公司,未經北京小度信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810539556.6/1.html,轉載請聲明來源鉆瓜專利網。





