[發(fā)明專利]網(wǎng)頁主圖識別方法和裝置有效
| 申請?zhí)枺?/td> | 201611259514.4 | 申請日: | 2016-12-30 |
| 公開(公告)號: | CN108268488B | 公開(公告)日: | 2022-04-19 |
| 發(fā)明(設(shè)計)人: | 秦首科;韓友;徐培治;邱學(xué)忠;馬小林 | 申請(專利權(quán))人: | 百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
| 主分類號: | G06F16/953 | 分類號: | G06F16/953;G06F16/958 |
| 代理公司: | 北京志霖恒遠(yuǎn)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11435 | 代理人: | 陳姍姍 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 網(wǎng)頁 識別 方法 裝置 | ||
1.一種網(wǎng)頁主圖識別方法,其特征在于,包括:
基于網(wǎng)頁中各圖片的頁面屬性,篩選出候選主圖;
根據(jù)候選主圖的信息主題,對候選主圖的原始圖片進(jìn)行裁剪,得到突出所述信息主題的圖片構(gòu)圖;
確定出信息主題與所述網(wǎng)頁的主題匹配的候選主圖;以及
將匹配的候選主圖所對應(yīng)的圖片構(gòu)圖識別為所述網(wǎng)頁的主圖;
所述根據(jù)候選主圖的信息主題,對候選主圖的原始圖片進(jìn)行裁剪,得到對應(yīng)的圖片構(gòu)圖,包括:
利用基于深度學(xué)習(xí)的第一模型工具,識別候選主圖的信息主題;以及
利用所述第一模型工具,對候選主圖的原始圖片進(jìn)行裁剪,以得到突出所述信息主題的圖片構(gòu)圖;
利用機(jī)器學(xué)習(xí)模型學(xué)習(xí)樣本圖片與信息主題之間的對應(yīng)關(guān)系、信息主題與圖片構(gòu)圖之間的對應(yīng)關(guān)系、樣本圖片與圖片構(gòu)圖之間的對應(yīng)關(guān)系,得到所述第一模型工具。
2.根據(jù)權(quán)利要求1所述的識別方法,其特征在于,所述頁面屬性包括如下至少一項:頁面位置、屏幕占比。
3.根據(jù)權(quán)利要求2所述的識別方法,其特征在于,所述根據(jù)網(wǎng)頁中各圖片的頁面屬性,篩選出候選主圖,包括:將網(wǎng)頁中滿足以下任一條件的圖片篩選為候選主圖:
圖片的頁面位置與預(yù)設(shè)中心位置之間的差值小于第一閾值;
圖片的屏幕占比超過第二閾值。
4.根據(jù)權(quán)利要求1所述的識別方法,其特征在于,所述網(wǎng)頁的主題根據(jù)用戶為該網(wǎng)頁配置的競價詞而確定。
5.根據(jù)權(quán)利要求1所述的識別方法,其特征在于,所述篩選出候選主圖之后,還包括:
獲取所述候選主圖的圖片類型;以及
過濾指定的圖片類型的候選主圖,其中,所述指定的圖片類型包括如下至少一項:紋理類型、二維碼類型。
6.根據(jù)權(quán)利要求5所述的識別方法,其特征在于,所述獲取所述候選主圖的圖片類型,包括:
利用基于深度學(xué)習(xí)的第二模型工具,對所述候選主圖的原始圖片進(jìn)行分類,確定出所述候選主圖的圖片類型。
7.根據(jù)權(quán)利要求1-6任一所述的識別方法,其特征在于,還包括:
接收到查詢主題后,查找信息主題與所述查詢主題匹配的主圖;以及
將匹配的主圖進(jìn)行展示。
8.一種網(wǎng)頁主圖識別裝置,其特征在于,包括:
屬性篩選單元,配置用于基于網(wǎng)頁中各圖片的頁面屬性,篩選出候選主圖;
構(gòu)圖裁剪單元,配置用于根據(jù)候選主圖的信息主題,對候選主圖的原始圖片進(jìn)行裁剪,得到突出所述信息主題的圖片構(gòu)圖;
主題匹配單元,配置用于確定出信息主題與所述網(wǎng)頁的主題匹配的候選主圖;以及
主圖識別單元,配置用于將匹配的候選主圖所對應(yīng)的圖片構(gòu)圖識別為所述網(wǎng)頁的主圖;
所述構(gòu)圖裁剪單元配置用于利用基于深度學(xué)習(xí)的第一模型工具,識別候選主圖的信息主題;以及利用基于深度學(xué)習(xí)的第一模型工具,對候選主圖的原始圖片進(jìn)行裁剪,以得到突出所述信息主題的圖片構(gòu)圖;
利用機(jī)器學(xué)習(xí)模型學(xué)習(xí)樣本圖片與信息主題之間的對應(yīng)關(guān)系、信息主題與圖片構(gòu)圖之間的對應(yīng)關(guān)系、樣本圖片與圖片構(gòu)圖之間的對應(yīng)關(guān)系,得到所述第一模型工具。
9.根據(jù)權(quán)利要求8所述的識別裝置,其特征在于,所述頁面屬性包括如下至少一項:頁面位置、屏幕占比。
10.根據(jù)權(quán)利要求9所述的識別裝置,其特征在于,
所述屬性篩選單元配置用于將網(wǎng)頁中滿足以下任一條件的圖片篩選為候選主圖:
圖片的頁面位置與預(yù)設(shè)中心位置之間的差值小于第一閾值;
圖片的屏幕占比超過第二閾值。
11.根據(jù)權(quán)利要求8所述的識別裝置,其特征在于,所述網(wǎng)頁的主題根據(jù)用戶為該網(wǎng)頁配置的競價詞而確定。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司,未經(jīng)百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611259514.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





