日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種網頁內容提取方法及裝置有效

專利信息
申請?zhí)枺?/td> 201611126527.4 申請日: 2016-12-09
公開(公告)號: CN107741942B 公開(公告)日: 2020-06-02
發(fā)明(設計)人: 趙銘鑫 申請(專利權)人: 騰訊科技(深圳)有限公司
主分類號: G06F16/958 分類號: G06F16/958
代理公司: 廣州三環(huán)專利商標代理有限公司 44202 代理人: 郝傳鑫;賈允
地址: 518000 廣東省深圳*** 國省代碼: 廣東;44
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 網頁 內容 提取 方法 裝置
【權利要求書】:

1.一種網頁內容提取方法,其特征在于,包括:

確定待提取網頁中目標內容所在的候選區(qū)域,包括:

根據預先統(tǒng)計的網頁中各個待提取內容所在的區(qū)域的集合,確定所述目標內容在所述待提取網頁中的候選區(qū)域,其中,所述各個待提取內容所在區(qū)域的集合是通過預先統(tǒng)計預設數量的網頁中各個待提取內容的位置信息并合并待提取內容在各個網頁中的位置信息形成的集合;

根據所述目標內容的預設視覺特征,計算每個所述候選區(qū)域的視覺特征得分;

從視覺特征得分最高的候選區(qū)域提取所述目標內容。

2.根據權利要求1所述的方法,其特征在于,所述根據所述目標內容的預設視覺特征,計算每個所述候選區(qū)域的視覺特征得分包括:

計算每個所述候選區(qū)域內存在的,與各個所述預設視覺特征對應的各個視覺特征的得分;

將每個所述候選區(qū)域內的所述各個視覺特征的得分累加,作為每個所述候選區(qū)域的視覺特征得分。

3.根據權利要求2所述的方法,其特征在于,所述計算每個所述候選區(qū)域內存在的,與各個所述預設視覺特征對應的各個視覺特征的得分包括:

判斷每個所述候選區(qū)域內的所述各個視覺特征,是否與對應的各個所述預設視覺特征匹配;

確定與對應的所述預設視覺特征匹配的視覺特征的得分,等于對應的所述預設視覺特征的預設分值;

確定與對應的所述預設視覺特征不匹配的視覺特征的得分,等于零。

4.根據權利要求3所述的方法,其特征在于,所述匹配包括:所述視覺特征與對應的所述預設視覺特征相同,或所述視覺特征的參數屬于對應的所述預設視覺特征的參數區(qū)間。

5.根據權利要求3或4所述的方法,其特征在于,所述方法還包括:

測試所提取的所述目標內容是否準確;

根據測試結果調整所述目標內容的各個預設視覺特征的預設分值。

6.一種網頁內容提取裝置,其特征在于,包括:

確定單元,用于確定待提取網頁中目標內容所在的候選區(qū)域,具體用于,根據預先統(tǒng)計的網頁中各個待提取內容所在的區(qū)域的集合,確定所述目標內容在所述待提取網頁中的候選區(qū)域,其中,所述各個待提取內容所在區(qū)域的集合是通過預先統(tǒng)計預設數量的網頁中各個待提取內容的位置信息并合并待提取內容在各個網頁中的位置信息形成的集合;

計算單元,用于根據所述目標內容的預設視覺特征,計算每個所述候選區(qū)域的視覺特征得分;

提取單元,用于從視覺特征得分最高的候選區(qū)域提取所述目標內容。

7.根據權利要求6所述的裝置,其特征在于,所述計算單元包括:

第一計算單元,用于計算每個所述候選區(qū)域內存在的,與各個所述預設視覺特征對應的各個視覺特征的得分;

第二計算單元,用于將每個所述候選區(qū)域內的所述各個視覺特征的得分累加,作為每個所述候選區(qū)域的視覺特征得分。

8.根據權利要求7所述的裝置,其特征在于,所述第一計算單元包括:

判斷子單元,用于判斷每個所述候選區(qū)域內的所述各個視覺特征,是否與對應的各個所述預設視覺特征匹配;

確定子單元,用于確定與對應的所述預設視覺特征匹配的視覺特征的得分,等于對應的所述預設視覺特征的預設分值;以及確定與對應的所述預設視覺特征不匹配的視覺特征的得分,等于零。

9.根據權利要求8所述的裝置,其特征在于,所述匹配包括:所述視覺特征與對應的所述預設視覺特征相同,或所述視覺特征的參數屬于對應的所述預設視覺特征的參數區(qū)間。

10.根據權利要求8或9所述的裝置,其特征在于,所述裝置還包括:

測試單元,用于測試所提取的所述目標內容是否準確;

調整單元,用于根據測試結果調整所述目標內容的各個預設視覺特征的預設分值。

11.一種計算機可讀存儲介質,所述存儲介質中存儲有至少一條指令、至少一段程序、代碼集或指令集,所述至少一條指令、所述至少一段程序、所述代碼集或指令集由處理器加載并執(zhí)行如權利要求1-5任一所述的方法。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201611126527.4/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 99热久久这里只精品国产www| 91精品高清| 91麻豆精品国产91久久久更新时间| 国产精品一区在线观看你懂的 | 毛片大全免费观看| 亚洲一级中文字幕| 欧美日韩一区二区三区69堂| 午夜av影视| 欧美69精品久久久久久不卡| 国产精品久久久久久久久久久杏吧| 日日夜夜精品免费看| 91麻豆精品国产91久久久更新资源速度超快 | 国产二区三区视频| 欧美在线视频一区二区三区| 午夜特片网| 日韩精品一区二区不卡| 色综合久久久| 亚洲精品国产精品国产| 国产伦理久久精品久久久久| 国产一级二级在线| 国产麻豆精品久久| 久久精品综合视频| 99精品一级欧美片免费播放| 国产99网站| 亚洲欧美国产中文字幕| 亚洲欧美一区二区三区不卡| 欧美久久久一区二区三区| 国产偷亚洲偷欧美偷精品| 精品日韩久久久| 美女张开腿黄网站免费| 亚洲三区二区一区| 综合色婷婷一区二区亚洲欧美国产| 国产高清精品一区二区| av午夜剧场| 福利片91| 欧美高清xxxxx| 久久中文一区二区| 午夜伦理在线观看| 欧美67sexhd| 精品综合久久久久| 一色桃子av| 日韩精品一区在线视频| 精品久久久综合| 97一区二区国产好的精华液| 国产麻豆91欧美一区二区| 国产大片一区二区三区| 午夜爽爽视频| 91精品www| 日韩亚洲国产精品| 欧美国产一二三区| 99精品国产一区二区三区不卡| 国产精品久久久久久久久久久久久久久久 | 狠狠综合久久av一区二区老牛| 香港三日三级少妇三级99| 国产精品自产拍在线观看蜜| 国产一区二区电影在线观看| 欧美日韩国产精品一区二区| 国产精品日韩视频| 国产日韩欧美另类| 一区二区不卡在线| 香港三日本三级三级三级| 亚洲国产另类久久久精品性| 性欧美激情日韩精品七区| www.久久精品视频| 国产主播啪啪| 大bbw大bbw巨大bbw看看| 国产性猛交| 欧美一区二区性放荡片| 日本午夜影视| 精品久久不卡| 91午夜精品一区二区三区| 欧美日韩中文字幕一区二区三区| 欧美一级片一区| 国产一区二区午夜| 7799国产精品久久99| 国产精品日韩在线观看| 日韩欧美一区精品| 日本护士hd高潮护士| 久热精品视频在线| 国产88久久久国产精品免费二区| 国产亚洲精品久久777777| 91精品夜夜|