[發(fā)明專利]一種對(duì)象抓取方法在審
| 申請(qǐng)?zhí)枺?/td> | 201810287683.1 | 申請(qǐng)日: | 2018-03-30 |
| 公開(kāi)(公告)號(hào): | CN110569452A | 公開(kāi)(公告)日: | 2019-12-13 |
| 發(fā)明(設(shè)計(jì))人: | 吳麗璇 | 申請(qǐng)(專利權(quán))人: | 佛山市優(yōu)特美邦電子商務(wù)有限公司 |
| 主分類號(hào): | G06F16/955 | 分類號(hào): | G06F16/955;G06Q30/06 |
| 代理公司: | 44446 廣州潤(rùn)禾知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人: | 周鄭奇;林名欽 |
| 地址: | 528031 廣東省*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 抓取 鏈接網(wǎng)址 網(wǎng)頁(yè) 標(biāo)準(zhǔn)對(duì)象 鏈接特征 商品對(duì)象 商品展示 鏈接 子類 內(nèi)存 頁(yè)面 標(biāo)準(zhǔn)化 分析 輸出 釋放 返回 聲明 展示 | ||
1.一種對(duì)象抓取方法,包括:
S1.輸入商品鏈接;
S2.對(duì)商品鏈接網(wǎng)址對(duì)應(yīng)網(wǎng)頁(yè)進(jìn)行分析,并根據(jù)展示需要抓取網(wǎng)頁(yè)上的對(duì)象;
S3.返回標(biāo)準(zhǔn)對(duì)象結(jié)構(gòu);
S4.釋放內(nèi)存;
其特征在于,步驟S2中根據(jù)子類聲明的商品鏈接特征判斷是商品列表頁(yè)還是商品展示頁(yè),并對(duì)不同類型的頁(yè)面進(jìn)行不同的分析。
2.根據(jù)權(quán)利要求1所述的一種對(duì)象抓取方法,其特征在于,對(duì)商品列表頁(yè)的分析包括:
S21.根據(jù)超文本傳輸協(xié)議響應(yīng)的對(duì)象類型生成網(wǎng)頁(yè)對(duì)象元素或爪哇對(duì)象標(biāo)記解析結(jié)果;
S22.根據(jù)網(wǎng)頁(yè)對(duì)象元素或爪哇對(duì)象標(biāo)記解析結(jié)果分析出這個(gè)列表的各個(gè)元素。
3.根據(jù)權(quán)利要求2所述的一種對(duì)象抓取方法,其特征在于,步驟S22具體為根據(jù)網(wǎng)頁(yè)對(duì)象元素或爪哇對(duì)象標(biāo)記解析結(jié)果分析出商品列表頁(yè)的:
網(wǎng)頁(yè)標(biāo)題、字符串;
網(wǎng)頁(yè)標(biāo)簽、數(shù)組;
網(wǎng)頁(yè)產(chǎn)品集合、數(shù)組、元素為產(chǎn)品對(duì)象;
當(dāng)前列表共有多少頁(yè)、整型;
當(dāng)前列表共有多少子列表、數(shù)組、元素為列表對(duì)象。
4.根據(jù)權(quán)利要求1所述的一種對(duì)象抓取方法,其特征在于,對(duì)商品展示頁(yè)的分析包括:
S31.根據(jù)超文本傳輸協(xié)議響應(yīng)的對(duì)象類型生成網(wǎng)頁(yè)對(duì)象元素或爪哇對(duì)象標(biāo)記解析結(jié)果并放入內(nèi)存變量;
S32.根據(jù)網(wǎng)頁(yè)對(duì)象元素或爪哇對(duì)象標(biāo)記解析結(jié)果分析出這個(gè)頁(yè)面的各個(gè)元素。
5.根據(jù)權(quán)利要求4所述的一種對(duì)象抓取方法,其特征在于,步驟S32具體包括:
檢查商品是處于有貨還是無(wú)貨狀態(tài),如果無(wú)貨,將跳出執(zhí)行,如果有貨則繼續(xù)往下執(zhí)行;
分析貨號(hào)、字符串;
檢查貨號(hào)是否正常;
分析商品品牌名稱、字符串;
分析商品標(biāo)題、字符串;
分析商品標(biāo)簽、數(shù)組;
分析商品描述、字符串;
分析商品尺碼說(shuō)明、字符串;
分析商品顏色、數(shù)組、顏色對(duì)象集合;
分析商品庫(kù)存、數(shù)組、SKU對(duì)象集合;
分析商品圖片、數(shù)組,按照顏色I(xiàn)D為下標(biāo),圖片商品鏈接數(shù)組為元素;
分析商品視頻、數(shù)組,按照顏色I(xiàn)D為下標(biāo),視頻商品鏈接字符串為元素;
分析商品評(píng)論、數(shù)組、評(píng)論對(duì)象集合;
分析商品搭配產(chǎn)品/類似/同款其它色/套裝內(nèi)子項(xiàng)產(chǎn)品、數(shù)組、產(chǎn)品對(duì)象集合。
6.根據(jù)權(quán)利要求2-6任一項(xiàng)所述的一種對(duì)象抓取方法,其特征在于,生成網(wǎng)頁(yè)對(duì)象元素或爪哇對(duì)象標(biāo)記解析結(jié)果后將它們存到內(nèi)存變量中。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于佛山市優(yōu)特美邦電子商務(wù)有限公司,未經(jīng)佛山市優(yōu)特美邦電子商務(wù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810287683.1/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種搜索網(wǎng)頁(yè)的方法和裝置
- 網(wǎng)頁(yè)類型識(shí)別方法以及網(wǎng)頁(yè)類型識(shí)別裝置
- 網(wǎng)頁(yè)生成方法及網(wǎng)頁(yè)生成裝置
- 網(wǎng)頁(yè)修改方法及網(wǎng)頁(yè)修改裝置
- 網(wǎng)頁(yè)訪問(wèn)處理方法
- 獲取網(wǎng)頁(yè)信息方法和裝置
- 網(wǎng)頁(yè)資源的獲取方法、裝置及終端
- 一種網(wǎng)頁(yè)制作方法、系統(tǒng)、可讀存儲(chǔ)介質(zhì)及服務(wù)器
- 網(wǎng)頁(yè)安全處理方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 一種網(wǎng)頁(yè)同步的方法、系統(tǒng)
- 利用統(tǒng)計(jì)圖像規(guī)劃層析成像測(cè)量中斷層位置的方法
- 一種基于XML技術(shù)的MIB告警解析方法及系統(tǒng)
- 圖像處理方法、裝置、圖像識(shí)別設(shè)備及儲(chǔ)存介質(zhì)
- 數(shù)據(jù)處理方法、裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 業(yè)務(wù)對(duì)象確定方法和裝置
- 一種業(yè)務(wù)對(duì)象識(shí)別方法、裝置及設(shè)備
- 一種物業(yè)管理中的標(biāo)準(zhǔn)模板管理方法
- 數(shù)據(jù)處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 信息處理方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)
- 圖像匹配方法、裝置及計(jì)算機(jī)存儲(chǔ)介質(zhì)





