[發(fā)明專利]目標(biāo)頁面展示方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202111118207.5 | 申請(qǐng)日: | 2021-09-22 |
| 公開(公告)號(hào): | CN113920509A | 公開(公告)日: | 2022-01-11 |
| 發(fā)明(設(shè)計(jì))人: | 張博偉;董思文 | 申請(qǐng)(專利權(quán))人: | 北京三快在線科技有限公司 |
| 主分類號(hào): | G06V30/148 | 分類號(hào): | G06V30/148;G06F16/955;G06F16/958;G06V30/14 |
| 代理公司: | 北京三高永信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11138 | 代理人: | 謝冬寒 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 目標(biāo) 頁面 展示 方法 裝置 計(jì)算機(jī) 設(shè)備 存儲(chǔ) 介質(zhì) | ||
本公開揭示了一種目標(biāo)頁面展示方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì),屬于人工智能技術(shù)領(lǐng)域。該方法包括:獲取目標(biāo)頁面的頁面截圖;基于所述頁面截圖,獲取所述目標(biāo)頁面的頁面數(shù)據(jù),所述頁面數(shù)據(jù)包括文字內(nèi)容集合以及圖片內(nèi)容集合中的至少一種;將所述頁面數(shù)據(jù)輸入到頁面識(shí)別模型中,獲取目標(biāo)頁面信息;所述頁面識(shí)別模型是通過頁面樣本的樣本頁面數(shù)據(jù)訓(xùn)練得到的;所述目標(biāo)頁面信息用于指示目標(biāo)頁面的位置信息;基于所述目標(biāo)頁面信息,跳轉(zhuǎn)展示所述目標(biāo)頁面。通過頁面識(shí)別模型進(jìn)行目標(biāo)頁面識(shí)別不受限于開源環(huán)境,從而解決了可識(shí)別的目標(biāo)頁面局限性的問題,從而提高了目標(biāo)頁面識(shí)別的準(zhǔn)確性。
技術(shù)領(lǐng)域
本公開涉及人工智能技術(shù)領(lǐng)域,特別是涉及一種目標(biāo)頁面展示方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù)
目前,可以通過訓(xùn)練的分類器識(shí)別出開源頁面,并且獲取開源頁面中的開源軟件資源。
在相關(guān)技術(shù)中,根據(jù)所訓(xùn)練出的分類器識(shí)別出目標(biāo)頁面是否為開源軟件頁面。然后,通過在所識(shí)別出的開源軟件頁面中查找開源軟件資源并將其下載到本地,以實(shí)現(xiàn)對(duì)開源軟件資源的提取過程。
然而,相關(guān)技術(shù)中的方案,通過訓(xùn)練出的分類器識(shí)別頁面是否為開源軟件頁面,僅針對(duì)開源軟件頁面跳轉(zhuǎn)到開源軟件資源的下載頁面對(duì)開源軟件資源進(jìn)行下載,從而導(dǎo)致支持跳轉(zhuǎn)的目標(biāo)頁面具有局限性。
發(fā)明內(nèi)容
本公開提供一種目標(biāo)頁面展示方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。所述技術(shù)方案如下:
一方面,提供了一種目標(biāo)頁面展示方法,所述方法包括:
獲取目標(biāo)頁面的頁面截圖;
基于所述頁面截圖,獲取所述目標(biāo)頁面的頁面數(shù)據(jù),所述頁面數(shù)據(jù)包括文字內(nèi)容集合以及圖片內(nèi)容集合中的至少一種;
將所述頁面數(shù)據(jù)輸入到頁面識(shí)別模型中,獲取目標(biāo)頁面信息;所述頁面識(shí)別模型是通過樣本頁面的樣本頁面數(shù)據(jù)訓(xùn)練得到的;所述目標(biāo)頁面信息用于指示目標(biāo)頁面的位置信息;
基于所述目標(biāo)頁面信息,跳轉(zhuǎn)展示所述目標(biāo)頁面。
在一種可能的實(shí)現(xiàn)方式中,所述將所述頁面數(shù)據(jù)輸入到頁面識(shí)別模型中,獲取目標(biāo)頁面信息之前,還包括:
獲取所述樣本頁面的所述樣本頁面數(shù)據(jù);
將所述樣本頁面數(shù)據(jù)輸入所述頁面識(shí)別模型,獲得所述頁面識(shí)別模型輸出的預(yù)測頁面信息;
基于所述預(yù)測頁面信息,以及所述樣本頁面的頁面信息標(biāo)簽獲取損失函數(shù)值;
基于所述損失函數(shù)值對(duì)所述頁面識(shí)別模型的模型參數(shù)進(jìn)行更新。
在一種可能的實(shí)現(xiàn)方式中,所述獲取所述樣本頁面的所述樣本頁面數(shù)據(jù),包括:
獲取所述樣本頁面的頁面樣本源碼;
基于所述頁面樣本源碼,獲取所述樣本頁面的所述樣本頁面數(shù)據(jù)。
在一種可能的實(shí)現(xiàn)方式中,所述獲取所述樣本頁面的所述樣本頁面數(shù)據(jù),包括:
獲取從第一接口返回的第一數(shù)據(jù);所述第一接口是用于展示所述樣本頁面過程中進(jìn)行數(shù)據(jù)交互的接口;所述第一數(shù)據(jù)是用于展示所述樣本頁面的動(dòng)態(tài)數(shù)據(jù);
基于所述第一數(shù)據(jù),獲取所述樣本頁面的所述樣本頁面數(shù)據(jù)。
在一種可能的實(shí)現(xiàn)方式中,所述基于所述頁面截圖,獲取所述目標(biāo)頁面的頁面數(shù)據(jù),包括:
響應(yīng)于所述頁面數(shù)據(jù)包括文字內(nèi)容集合,基于OCR光學(xué)字符識(shí)別技術(shù),對(duì)所述頁面截圖進(jìn)行文字識(shí)別,獲得所述目標(biāo)頁面的文字內(nèi)容集合;
響應(yīng)于所述頁面數(shù)據(jù)包括圖片內(nèi)容集合,基于所述頁面截圖中除了文字區(qū)域之外的區(qū)域,獲取所述目標(biāo)頁面的所述圖片內(nèi)容集合。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京三快在線科技有限公司,未經(jīng)北京三快在線科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111118207.5/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 目標(biāo)檢測裝置、學(xué)習(xí)裝置、目標(biāo)檢測系統(tǒng)及目標(biāo)檢測方法
- 目標(biāo)監(jiān)測方法、目標(biāo)監(jiān)測裝置以及目標(biāo)監(jiān)測程序
- 目標(biāo)監(jiān)控系統(tǒng)及目標(biāo)監(jiān)控方法
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤設(shè)備
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤裝置
- 目標(biāo)檢測方法和目標(biāo)檢測裝置
- 目標(biāo)跟蹤方法、目標(biāo)跟蹤裝置、目標(biāo)跟蹤設(shè)備
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)跟蹤系統(tǒng)及目標(biāo)跟蹤方法
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





