日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種網(wǎng)頁內(nèi)容抽取裝置和方法有效

專利信息
申請?zhí)枺?/td> 201310464472.8 申請日: 2013-10-08
公開(公告)號: CN103559202A 公開(公告)日: 2014-02-05
發(fā)明(設(shè)計)人: 王志剛 申請(專利權(quán))人: 北京奇虎科技有限公司;奇智軟件(北京)有限公司
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 北京市隆安律師事務(wù)所 11323 代理人: 權(quán)鮮枝;何立春
地址: 100088 北京市西城區(qū)新*** 國省代碼: 北京;11
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 網(wǎng)頁 內(nèi)容 抽取 裝置 方法
【權(quán)利要求書】:

1.一種網(wǎng)頁內(nèi)容抽取裝置,其中,該裝置包括:

訓(xùn)練單元,適于根據(jù)訓(xùn)練數(shù)據(jù)定義不同類型的塊,以及不同的分類特征;

其中,網(wǎng)頁由多個不同類型的塊組成,每種類型的塊對應(yīng)一個分類特征值集合,一個分類特征值集合由分別取對應(yīng)特定值的一個或多個分類特征組成,不同類型的塊通過各自對應(yīng)的分類特征值集合進行區(qū)分;

解析單元,適于將當(dāng)前網(wǎng)頁解析成文檔對象模型DOM樹;

特征獲取單元,適于獲取所述DOM樹的每個結(jié)點的分類特征值集合;

塊類型確定單元,適于根據(jù)所定義的所有分類特征以及每種類型的塊對應(yīng)的分類特征值集合,確定所述DOM樹的每個結(jié)點是否為塊,以及塊的類型;

內(nèi)容抽取單元,適于對所述DOM樹的被確定為塊的結(jié)點,如果對應(yīng)的塊類型為需要抽取的類型,則取出該結(jié)點的內(nèi)容。

2.如權(quán)利要求1所述的裝置,其中,

所述特征獲取單元,適于采用后根遍歷方式獲得所述DOM樹的每個結(jié)點的分類特征值集合。

3.如權(quán)利要求1所述的裝置,其中,

所述塊類型確定單元,適于將所定義的所有分類特征以及每種類型的塊對應(yīng)的分類特征值集合輸入決策樹,利用決策樹按照先根遍歷方式判決所述DOM樹的每個結(jié)點是否為塊,以及塊的類型,并按照遍歷的順序輸出塊序列。

4.如權(quán)利要求3所述的裝置,其中,該裝置進一步包括:

糾錯單元,適于利用條件隨機場CRF對所述塊類型確定單元輸出的塊序列中的塊的類型進行糾錯處理。

5.如權(quán)利要求1至4中任一項所述的裝置,其中,

所述訓(xùn)練單元,進一步適于根據(jù)新增的訓(xùn)練數(shù)據(jù)對分類特征和/或塊的類型進行擴充,使得后續(xù)根據(jù)擴充后的結(jié)果進行網(wǎng)頁內(nèi)容抽取。

6.一種網(wǎng)頁內(nèi)容抽取方法,其中,包括:

根據(jù)訓(xùn)練數(shù)據(jù)定義不同類型的塊,以及不同的分類特征;其中,網(wǎng)頁由多個不同類型的塊組成,每種類型的塊對應(yīng)一個分類特征值集合,一個分類特征值集合由分別取對應(yīng)特定值的一個或多個分類特征組成,不同類型的塊通過各自對應(yīng)的分類特征值集合進行區(qū)分;

將當(dāng)前網(wǎng)頁解析成文檔對象模型DOM樹;

獲取所述DOM樹的每個結(jié)點的分類特征值集合;

根據(jù)所定義的所有分類特征以及每種類型的塊對應(yīng)的分類特征值集合,確定所述DOM樹的每個結(jié)點是否為塊,以及塊的類型;

對于所述DOM樹的被確定為塊的結(jié)點,如果對應(yīng)的塊類型為需要抽取的類型,則取出該結(jié)點的內(nèi)容。

7.如權(quán)利要求6所述的方法,其中,所述獲取所述DOM樹的每個結(jié)點的分類特征值集合包括:

采用后根遍歷方式獲得所述DOM樹的每個結(jié)點的分類特征值集合。

8.如權(quán)利要求6所述的方法,其中,所述根據(jù)所定義的所有分類特征以及每種類型的塊對應(yīng)的分類特征值集合,確定所述DOM樹的每個結(jié)點是否為塊,以及塊的類型包括:

將所定義的所有分類特征以及每種類型的塊對應(yīng)的分類特征值集合輸入決策樹,利用決策樹按照先根遍歷方式判決所述DOM樹的每個結(jié)點是否為塊,以及塊的類型,并按照遍歷的順序輸出塊序列。

9.如權(quán)利要求8所述的方法,其中,在所述按照遍歷的順序輸出塊序列之后,該方法進一步包括:利用條件隨機場CRF對所述塊序列中的塊的類型進行糾錯處理。

10.如權(quán)利要求6至9中任一項所述的方法,其中,該方法進一步包括:根據(jù)新增的訓(xùn)練數(shù)據(jù)對分類特征和/或塊的類型進行擴充;

后續(xù)根據(jù)擴充后的結(jié)果進行網(wǎng)頁內(nèi)容抽取。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京奇虎科技有限公司;奇智軟件(北京)有限公司,未經(jīng)北京奇虎科技有限公司;奇智軟件(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201310464472.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 日本一区二区三区免费在线| 淫片免费看| 亚洲欧美日韩一级| 国产一区日韩一区| 肥大bbwbbwbbw高潮| 国产精品一区二区免费视频| 在线国产二区| 国产精品久久久久久久龚玥菲| 国产极品美女高潮无套久久久| 国产精品亚州| 亚洲va国产| 亚洲欧美一卡二卡| 国产精品一二三四五区| 精品国产一二三四区| 91嫩草入口| 色一情一乱一乱一区99av白浆| 日韩av在线导航| 亚洲在线久久| 午夜激情免费电影| 91精品一区在线观看| 免费xxxx18美国| 欧美亚洲精品suv一区| 夜色av网| 91免费国产视频| 国产午夜精品一区二区三区最新电影| 91av中文字幕| 精品国产一区在线| 久久国产精久久精产国| 理论片高清免费理伦片| 国产欧美一区二区三区四区| 99国产伦精品一区二区三区| 91秒拍国产福利一区| 精品久久二区| 国产在线视频二区| 99欧美精品| 欧美精品一区二区三区久久久竹菊| 免费看性生活片| 亚洲精品91久久久久久| 精品国产乱码一区二区三区a| 久久人做人爽一区二区三区小说| 欧美一级片一区| 国产亚洲精品久久久久久久久动漫| 国产一区二区三区小说| 欧美日韩国产专区| 日韩精品一二区| 肥大bbwbbwbbw高潮| 香蕉av一区二区三区| 国产欧美一区二区三区在线看| 欧美二区在线视频| 亚洲欧美日韩精品suv| 夜夜嗨av禁果av粉嫩av懂色av| 国产视频一区二区不卡| xxxxx色| 国产精品视频久久久久久久| 国产精品日韩高清伦字幕搜索| 91九色精品| 欧美日韩一区二区高清| 麻豆精品久久久| 国产精品久久久久久久综合| 一区二区在线精品| 国产精品电影一区| 日韩av在线影视| 国产福利一区在线观看| 久久夜色精品久久噜噜亚| 亚洲国产精品综合| 美国三级日本三级久久99 | 97人人模人人爽人人喊38tv| 在线观看黄色91| 国产视频一区二区不卡 | 一区二区国产精品| 久久97国产| 热99re久久免费视精品频软件| 亚洲精品卡一卡二| 国产一区二区高清视频| 欧美精品一区久久| 国产精品综合在线| 粉嫩久久久久久久极品| 99久久国产免费| 欧美精品在线视频观看| 538国产精品| 国产精品国产亚洲精品看不卡15 | 久久99精品久久久大学生| 精品一区在线观看视频| 国偷自产一区二区三区在线观看| 精品日韩久久久| 中文无码热在线视频| 精品久久久久久中文字幕大豆网| 国产欧美三区| 26uuu亚洲电影在线观看| 国产真实一区二区三区| 国产一区二区极品| 精品99在线视频| 国产一级一区二区三区| 国产极品美女高潮无套久久久| 亚洲第一天堂久久| 亚洲欧美一二三| 伊人久久婷婷色综合98网| 久精品国产| 99久久婷婷国产综合精品草原| 久久一区二区三区视频| 国v精品久久久网| 欧美一区二区三区国产精品| 欧美精品中文字幕亚洲专区| 欧美乱妇在线视频播放| 国产一区二区免费电影| 麻豆精品一区二区三区在线观看| 中文在线一区二区三区| 欧美一级免费在线视频| 日本大码bbw肉感高潮| 精品一区在线观看视频| 人人澡超碰碰97碰碰碰| 三级视频一区| 国产高清一区二区在线观看| 51区亚洲精品一区二区三区| 国产精品你懂的在线| 欧美视屏一区二区| 夜夜嗨av一区二区三区中文字幕| 国久久久久久| 精品一区二区三区中文字幕| 免费看片一区二区三区| 狠狠色狠狠色合久久伊人| 女女百合互慰av| 国产精品视频久久| 99精品一级欧美片免费播放| 亚洲一区欧美| 午夜影院啊啊啊| 国产精品日本一区二区不卡视频 | 三级视频一区| 中文字幕区一区二| 精品国产仑片一区二区三区| 欧美国产一区二区在线| 午夜国产一区二区| 久久国产精品二区| 午夜肉伦伦影院九七影网| 99久久精品免费看国产交换| 国产精品无码永久免费888| 久久综合伊人77777麻豆最新章节 一区二区久久精品66国产精品 | 日韩精品一二区| 国产精品久久人人做人人爽| 国产69精品久久久久999天美| 亚洲欧美一区二区精品久久久| 精品久久一区| 精品一区二区三区中文字幕| 97人人模人人爽人人喊38tv| 精品久久久综合| 久久狠狠高潮亚洲精品| 国产一区二区伦理| 国产精品国产三级国产专区55| 亚洲三区二区一区| 国产无套精品一区二区| 国产69精品福利视频| 国产精品5区| 国产精品久久久久久久久久不蜜月| 欧美日韩一区免费| 精品一区二区超碰久久久| 亚洲乱亚洲乱妇28p| 狠狠操很很干| 亚洲精品日日夜夜| 欧美日韩久久一区二区| 久久国产精品99国产精| 一级黄色片免费网站| 色一情一乱一乱一区99av白浆| 亚洲精品无吗| 欧美激情图片一区二区| 国产精品美女久久久另类人妖| 性欧美一区二区三区| 欧美日韩一区二区高清| 日本神影院一区二区三区| 精品国产一区二区三区久久久久久| 国产.高清,露脸,对白| 爽妇色啪网| 国产午夜伦理片| 国产精品视频久久久久久| 国产精品久久久久久久妇女| 性少妇freesexvideos高清bbw| 亚洲va欧美va国产综合先锋| 日韩国产精品一区二区| 激情久久一区二区三区| ass韩国白嫩pics| 免费看性生活片| 国产欧美一区二区精品久久久| 99久久精品免费视频| 亚洲精品国产一区| 少妇久久免费视频| 国产一区欧美一区| 日本少妇高潮xxxxⅹ| 日韩精品999| 国产精品一区二区毛茸茸| 91精品国产高清一区二区三区| 午夜影院h| 国产精品久久人人做人人爽| 青苹果av| 日本一区二区免费电影| 国产在线不卡一| 国产91一区| 狠狠色噜噜狠狠狠四色米奇| 国产午夜三级一二三区| 一区二区三区国产欧美| 99视频一区| 久久夜色精品亚洲噜噜国产mv| 国产精品伦一区二区三区级视频频 | 国产偷国产偷亚洲清高| 波多野结衣巨乳女教师| 91一区在线观看| 久久久久久久久亚洲精品| 免费a级毛片18以上观看精品| 特级免费黄色片| 亚洲欧美日本一区二区三区| 亚洲精品丝袜| 欧美激情精品久久久久久免费| 亚洲国产精品一区在线| 欧美日韩综合一区| 日韩夜精品精品免费观看| 日韩毛片一区| 91av精品| 欧美日韩综合一区二区| 亚洲精品国产精品国产| 久久影院国产精品| 日本xxxxxxxxx68护士| 亚洲欧美一卡| 国产乱人伦精品一区二区| 国产精品自产拍在线观看蜜| 国产一区网址| 日韩av在线中文| 亚洲二区在线播放视频| 日韩一级片在线免费观看| 久久精品com| 国产人澡人澡澡澡人碰视 | 午夜影院色| 国产视频一区二区在线| 99久久久久久国产精品| 视频一区欧美| 精品999久久久| 国产真实一区二区三区| 性色av色香蕉一区二区三区| 国产电影精品一区| 日韩亚洲精品视频| 91一区二区三区在线| 91精品视频一区二区| 中文字幕制服狠久久日韩二区| 久久中文一区二区| 午夜av资源| 国产精品第157页| 性夜影院在线观看| 国产精品偷伦一区二区| www色视频岛国|