[發(fā)明專利]網(wǎng)頁編碼的分析方法及裝置有效
| 申請?zhí)枺?/td> | 201410588752.4 | 申請日: | 2014-10-28 |
| 公開(公告)號: | CN105630790B | 公開(公告)日: | 2019-06-04 |
| 發(fā)明(設(shè)計)人: | 王兆平 | 申請(專利權(quán))人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F16/958 | 分類號: | G06F16/958;G06F11/36 |
| 代理公司: | 北京潤澤恒知識產(chǎn)權(quán)代理有限公司 11319 | 代理人: | 蘇培華 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 開曼群島;KY |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 網(wǎng)頁 編碼 分析 方法 裝置 | ||
1.一種網(wǎng)頁編碼的分析方法,其特征在于,包括:
讀取待檢測的目標網(wǎng)頁,確定所述目標網(wǎng)頁中待檢測的目標元素對象;
在所述目標網(wǎng)頁中,獲取與所述目標元素對象存在特定結(jié)構(gòu)關(guān)系的相關(guān)元素對象,包括:獲取與所述目標元素對象存在特定結(jié)構(gòu)關(guān)系的兩個或兩個以上的相關(guān)元素對象,并將所述兩個或兩個以上的相關(guān)元素對象的信息表示為第一數(shù)組;
將所述相關(guān)元素對象與預(yù)置的期望元素進行對比,包括:將所述第一數(shù)組與預(yù)置的第二數(shù)組進行對比;所述第二數(shù)組包括所述預(yù)置的期望元素的信息,并與所述第一數(shù)組具有相同的數(shù)據(jù)結(jié)構(gòu);其中,所述預(yù)置的期望元素包括:當網(wǎng)頁代碼編寫正確時,與目標元素對象存在特定結(jié)構(gòu)關(guān)系的正確的元素對象或多個元素對象的組合;
根據(jù)對比的結(jié)果,確定所述目標網(wǎng)頁在所述目標元素對象或所述相關(guān)元素對象處是否存在編碼錯誤。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定所述目標網(wǎng)頁中待檢測的目標元素對象,包括:
在所述目標網(wǎng)頁中,根據(jù)預(yù)置字符串查詢各元素對象對應(yīng)的唯一標識信息,根據(jù)查詢到的相匹配的元素對象,確定所述目標網(wǎng)頁中待檢測的目標元素對象。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取與所述目標元素對象存在特定結(jié)構(gòu)關(guān)系的相關(guān)元素對象,包括:
獲取與所述目標元素對象存在特定結(jié)構(gòu)關(guān)系的以下相關(guān)元素對象:
目標元素對象的父元素;
目標元素對象的下一個兄弟元素;
目標元素對象的上一個兄弟元素;
目標元素對象的子元素。
4.根據(jù)權(quán)利要求1-3任一項所述的方法,其特征在于,還包括:
在確定所述目標網(wǎng)頁在所述目標元素對象或所述相關(guān)元素對象處存在編碼錯誤后,返回編碼錯誤的元素對象的信息。
5.一種網(wǎng)頁編碼的分析裝置,其特征在于,包括:
目標元素確定單元,用于讀取待檢測的目標網(wǎng)頁,確定所述目標網(wǎng)頁中待檢測的目標元素對象;
相關(guān)元素獲取單元,用于在所述目標網(wǎng)頁中,獲取與所述目標元素對象存在特定結(jié)構(gòu)關(guān)系的相關(guān)元素對象;所述相關(guān)元素獲取單元,包括:第二相關(guān)元素獲取子單元,用于獲取與所述目標元素對象存在特定結(jié)構(gòu)關(guān)系的兩個或兩個以上的相關(guān)元素對象,并將所述兩個或兩個以上的相關(guān)元素對象的信息表示為第一數(shù)組;
元素對比單元,用于將所述相關(guān)元素對象與預(yù)置的期望元素進行對比;所述元素對比單元,包括:元素對比子單元,用于將所述第一數(shù)組與預(yù)置的第二數(shù)組進行對比;所述第二數(shù)組包括所述預(yù)置的期望元素的信息,并與所述第一數(shù)組具有相同的數(shù)據(jù)結(jié)構(gòu);其中,所述預(yù)置的期望元素包括:當網(wǎng)頁代碼編寫正確時,與目標元素對象存在特定結(jié)構(gòu)關(guān)系的正確的元素對象或多個元素對象的組合;
錯誤確定單元,用于根據(jù)對比的結(jié)果,確定所述目標網(wǎng)頁在所述目標元素對象或所述相關(guān)元素對象處是否存在編碼錯誤。
6.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述目標元素確定單元,包括:
目標元素確定子單元,用于在所述目標網(wǎng)頁中,根據(jù)預(yù)置字符串查詢各元素對象對應(yīng)的唯一標識信息,根據(jù)查詢到的相匹配的元素對象,確定所述目標網(wǎng)頁中待檢測的目標元素對象。
7.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述相關(guān)元素獲取單元,包括:
第一相關(guān)元素獲取子單元,用于獲取與所述目標元素對象存在特定結(jié)構(gòu)關(guān)系的以下相關(guān)元素對象:
目標元素對象的父元素;
目標元素對象的下一個兄弟元素;
目標元素對象的上一個兄弟元素;
目標元素對象的子元素。
8.根據(jù)權(quán)利要求5-7任一項所述的裝置,其特征在于,還包括:
錯誤信息返回單元,用于在確定所述目標網(wǎng)頁在所述目標元素對象或所述相關(guān)元素對象處存在編碼錯誤后,返回編碼錯誤的元素對象的信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團控股有限公司,未經(jīng)阿里巴巴集團控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410588752.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





