[發(fā)明專利]一種新聞列表區(qū)域的確定方法及裝置有效
| 申請?zhí)枺?/td> | 201611238479.8 | 申請日: | 2016-12-28 |
| 公開(公告)號: | CN106802933B | 公開(公告)日: | 2020-04-10 |
| 發(fā)明(設(shè)計)人: | 王勇 | 申請(專利權(quán))人: | 東軟集團(tuán)股份有限公司 |
| 主分類號: | G06F16/957 | 分類號: | G06F16/957 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 110179 遼*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 新聞 列表 區(qū)域 確定 方法 裝置 | ||
1.一種新聞列表區(qū)域的確定方法,其特征在于,所述方法包括:
判斷目標(biāo)頁面塊中是否包含滿足預(yù)設(shè)分割條件的頁面子塊;
當(dāng)所述目標(biāo)頁面塊中包含所述滿足預(yù)設(shè)分割條件的頁面子塊時,將所述滿足預(yù)設(shè)分割條件的頁面子塊作為目標(biāo)頁面塊分割為多個頁面子塊,轉(zhuǎn)入執(zhí)行所述判斷目標(biāo)頁面塊中是否包含滿足預(yù)設(shè)分割條件的頁面子塊;
當(dāng)所述目標(biāo)頁面塊中不包含滿足所述預(yù)設(shè)分割條件的頁面子塊時,基于所述目標(biāo)頁面塊中的頁面子塊判斷所述目標(biāo)頁面塊是否滿足預(yù)設(shè)新聞列表判定條件,當(dāng)所述目標(biāo)頁面塊滿足所述預(yù)設(shè)新聞列表判定條件時,將所述目標(biāo)頁面塊確定為新聞列表區(qū)域。
2.根據(jù)權(quán)利要求1所述的新聞列表區(qū)域的確定方法,其特征在于,所述判斷目標(biāo)頁面塊中是否包含滿足預(yù)設(shè)分割條件的頁面子塊,包括:
在所述目標(biāo)頁面塊中查找在目標(biāo)頁面中所占比例大于預(yù)設(shè)值,且在所述目標(biāo)頁面中的位置滿足預(yù)設(shè)位置條件的頁面子塊,獲得查找結(jié)果;
當(dāng)所述查找結(jié)果表明在所述目標(biāo)頁面塊中查找到在所述目標(biāo)頁面中所占比例大于所述預(yù)設(shè)值,且在所述目標(biāo)頁面中的位置滿足所述預(yù)設(shè)位置條件的頁面子塊時,判定所述目標(biāo)頁面塊中包含滿足所述預(yù)設(shè)分割條件的頁面子塊。
3.根據(jù)權(quán)利要求2所述的新聞列表區(qū)域的確定方法,其特征在于,所述預(yù)設(shè)位置條件為:在水平方向上位于所述目標(biāo)頁面的中部,且在垂直方向上位于所述目標(biāo)頁面的中部或上部。
4.根據(jù)權(quán)利要求1中任意一項所述的新聞列表區(qū)域的確定方法,其特征在于,所述將所述目標(biāo)頁面塊分割為多個頁面子塊,包括:
基于VIPS算法將所述目標(biāo)頁面塊進(jìn)行一次分割,獲得所述多個頁面子塊。
5.根據(jù)權(quán)利要求1所述的新聞列表區(qū)域的確定方法,其特征在于,當(dāng)所述目標(biāo)頁面塊中滿足所述預(yù)設(shè)分割條件的頁面子塊為多個時,所述將所述滿足預(yù)設(shè)分割條件的頁面子塊作為目標(biāo)頁面塊分割為多個頁面子塊,執(zhí)行所述判斷目標(biāo)頁面塊中是否包含滿足預(yù)設(shè)分割條件的頁面子塊,包括:
當(dāng)所述目標(biāo)頁面塊中滿足所述預(yù)設(shè)分割條件的頁面子塊為多個時,對于每個所述滿足預(yù)設(shè)分割條件的頁面子塊,將該頁面子塊作為目標(biāo)頁面塊分割為多個頁面子塊,執(zhí)行所述判斷目標(biāo)頁面塊中是否包含滿足預(yù)設(shè)分割條件的頁面子塊。
6.根據(jù)權(quán)利要求1-5中任意一項所述的新聞列表區(qū)域的確定方法,其特征在于,所述基于所述目標(biāo)頁面塊中的多個頁面子塊判斷所述目標(biāo)頁面塊是否滿足預(yù)設(shè)新聞列表判定條件,包括:
判斷所述目標(biāo)頁面塊中頁面子塊的數(shù)量是否大于或等于預(yù)設(shè)數(shù)量;
當(dāng)所述目標(biāo)頁面塊中頁面子塊的數(shù)量大于或等于所述預(yù)設(shè)數(shù)量時,判斷所述目標(biāo)頁面塊中的各個頁面子塊是否同時滿足三個預(yù)設(shè)條件,當(dāng)所述目標(biāo)頁面塊中的各個頁面子塊同時滿足所述三個預(yù)設(shè)條件時,判定所述目標(biāo)頁面塊滿足所述預(yù)設(shè)新聞列表判定條件;
其中,所述三個預(yù)設(shè)條件分別為:所述各個頁面子塊均包含至少一個鏈接、所述各個頁面子塊具有相同的寬度、所述各個頁面子塊具有相同的鏈接密度。
7.一種新聞列表區(qū)域的確定裝置,其特征在于,所述裝置包括:第一判斷模塊、頁面分割模塊、第二判斷模塊和確定模塊;
所述第一判斷模塊,用于判斷目標(biāo)頁面塊中是否包含滿足預(yù)設(shè)分割條件的頁面子塊;
所述頁面分割模塊,用于當(dāng)所述第一判斷模塊判斷出所述目標(biāo)頁面塊中包含所述滿足預(yù)設(shè)分割條件的頁面子塊時,將所述滿足預(yù)設(shè)分割條件的頁面子塊作為目標(biāo)頁面塊分割為多個頁面子塊,并觸發(fā)所述第一判斷模塊判斷目標(biāo)頁面塊中是否包含滿足預(yù)設(shè)分割條件的頁面子塊;
所述第二判斷模塊,用于當(dāng)所述第一判斷模塊判斷出所述目標(biāo)頁面塊中不包含滿足所述預(yù)設(shè)分割條件的頁面子塊時,基于所述目標(biāo)頁面塊中的頁面子塊判斷所述目標(biāo)頁面塊是否滿足預(yù)設(shè)新聞列表判定條件;
所述確定模塊,用于當(dāng)所述第二判斷模塊判斷出所述目標(biāo)頁面塊滿足所述預(yù)設(shè)新聞列表判定條件時,將所述目標(biāo)頁面塊確定為新聞列表區(qū)域。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東軟集團(tuán)股份有限公司,未經(jīng)東軟集團(tuán)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611238479.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





