日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種WEB信息抽取方法無效

專利信息
申請號: 201210490141.7 申請日: 2012-11-27
公開(公告)號: CN103020170A 公開(公告)日: 2013-04-03
發明(設計)人: 宗競 申請(專利權)人: 江蘇樂買到網絡科技有限公司
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 蘇州威世朋知識產權代理事務所(普通合伙) 32235 代理人: 楊林潔
地址: 215123 江蘇省蘇州市蘇州工*** 國省代碼: 江蘇;32
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 web 信息 抽取 方法
【說明書】:

技術領域

發明屬于計算機網絡技術領域,尤其涉及一種網絡中WEB信息抽取方法。

背景技術

伴隨著Internet和計算機的普及和廣泛使用,現實生活中的紙質存檔信息都以電子文檔的形式存儲在計算機和網絡上,同時Internet中產生的數據呈井噴式的增長,各大領域信息均出現在不同站點的Web頁面上和數據庫中。但存儲在不同網點上的網頁信息主要以半結構化或者非結構化的HTML語義的形式出現,因此不能用于直接分析處理。將Web頁面上有用的數據提取出來,是如今網絡輿情分析系統方面的研究熱點。隨著網絡購物的發展,對Web頁面信息的抽取技術提出的更高的要求。

Web信息抽取技術(Information?Extraction)就是把網頁里包含的某些特定信息如用戶名、發表時間、IP地址、正文、評論、商品價格等信息抽取出來,進行結構化處理,組織成表格一樣的形式存入數據庫中。信息抽取系統的主要功能是從文本中抽取出符合特定目標的事實信息。通常,被抽取出來的信息的描述形式為結構化的數據結構,可以直接存入數據庫中,供用戶查詢以及進一步的分析利用。信息抽取技術的初始研究開始于20世紀60年代,這個時期主要的研究是提取自然語言文本。

隨著Web技術的快速發展,網絡用戶可以自由的針對特定的事件或對象在網頁中發表自己的觀點和看法,這使得網絡用戶評論以驚人的速度增長并且覆蓋了現實世界的各個領域,如經濟、政治、娛樂、網絡購物等。網絡用戶發表的評論信息是許多應用的重要信息來源,如網絡輿情的檢測與分析,這些應用需要一種準確高效的方法從大量不同的網站中收集輿情信息。

隨著國家對互聯網安全的重視,涌現出了網絡攻擊、輿情、郵件等各層面的監控分析系統,為網絡有害事件的發現、處理和評估提供了有力支持。但因這些信息具有海量性、定向性和復雜性等特點,除發現能力外,這些系統對有害事件的調查、取證等能力有限,目前仍然是依賴人工進行用戶行為重建,辦案效率低、周期長,只能采取重點突破的方式。

現有的技術中對網絡組織的研究很少,缺乏相應的技術監控手段支持,人工分析更無法滿足網絡組織這種大范圍、有組織、長程關聯的行為分析,現有的網絡組織發現技術零散的分布在輿情分析產品和文獻中。

為此需要對這些監控數據進行綜合分析。Web信息抽取技術的研究是對這些數據進行綜合分析的一個基礎性工作。只有將Web網頁中的相關信息很好的抽取出來,才能在輿情分析、搜索引擎等方面得到更好的應用。通過利用IP地址、采集信息、賬戶資料、頁面分析、使用時間、發布周期、地理分布、信息傾向性等多元數據進行信息抽取和特征分析,從而可以為決策人員提供更豐富的、多視角的、綜合的調查材料。

發明內容

為了克服上述背景技術中的不足之處,本發明提出了一種web信息抽取方法,該方法基于語義標記,包括正文抽取方法和評論抽取方法,其特征在于包括所述正文提取方法分成以下步驟實現:

第一步,設從線性序列的頭開始順序遍歷,遇到第一個F2評論屬性的語義標記停止,則最后一個F2正文屬性的語義標記節點的位置為POSlast,第一個具有F3評論屬性的語義標記節點的位置為POSfirst;

第二步,將頁面線性序列中0..POSfirst-1的子序列設為初始正文區,在該區域內選擇一個信息量最大的文本塊作為正文內容,設該正文內容節點對應的位置為POSarticle

第三步,將調整后的正文區序列區間的終止位置設置為POSlast=max(POSlast,POSarticle);

第四步,評論區序列區間的起始位置設置為POSfirst=max(POSlast,POSarticle)+1,從而完成正文區和評論區的切分;

其中,F2是表示正文結束特征的語義標記,?F3是表示評論開始特征的語義標記。

根據本發明的技術方案,還包括所述評論抽取方法具體包括步驟:

(1)多條評論的抽取模型,確定評論區后,評論區內線性序列的語法模型就簡化為F3*?(F3*CRF3*)*F4,該模式反映評論區的多條評論具有周期性重復的特征;

(2)評論抽取方法,依據上面OneReview的初始區間確定和起始位置計算的思想,已經可以確定一條評論回復序列的完整區間模式,進而就可以利用這個模式序列去識別評論區的所有其他評論;

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇樂買到網絡科技有限公司,未經江蘇樂買到網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201210490141.7/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 97国产精品久久| 性国产videofree极品| 亚洲欧美国产中文字幕| 国产一区二区在线精品| 亚洲区在线| 国产欧美日韩va另类在线播放 | 欧美激情在线一区二区三区| 久久精品视频中文字幕| 91麻豆精品国产91久久久久推荐资源| 国产精品精品视频一区二区三区| 日韩精品中文字幕在线| 久久久精品视频在线| 国产69精品久久久久app下载| 狠狠躁日日躁狂躁夜夜躁| 日本精品三区| 国产一级片子| 亚洲欧美一二三| 一区二区三区毛片| 亚洲欧美日韩视频一区| 91久久综合亚洲鲁鲁五月天| 亚洲精品一区二区三区香蕉| 国产一级自拍片| 精品久久久久久久久亚洲| 久久99精品久久久噜噜最新章节| 一区二区91| 黄色国产一区二区| av午夜在线| 欧美精品五区| 精品国产九九九| 少妇特黄v一区二区三区图片| 久久亚洲精品国产一区最新章节| 久久免费视频99| 中文字幕一区二区三区免费视频| 香蕉视频一区二区三区| 色妞妞www精品视频| 久久久久国产一区二区三区不卡| 99国产精品永久免费视频| 91丝袜诱惑| 狠狠色噜噜狠狠狠狠米奇7777| 日本一区二区三区电影免费观看| 色噜噜狠狠色综合中文字幕 | 玖玖国产精品视频| 国产精品一区在线播放| 手机看片国产一区| 亚洲精品456| 日韩欧美精品一区二区三区经典| 欧美三级午夜理伦三级老人| 国产99久久久国产精品免费看| 日韩精品中文字幕一区| 首页亚洲欧美制服丝腿| 国产乱人乱精一区二视频国产精品| 久久99中文字幕| 亚洲国产精品综合| 国产精品亚洲第一区| 一二三区欧美| 国产精品九九九九九| 欧美国产一区二区三区激情无套| 国产一区激情| 欧洲在线一区| 国产视频二区| 精品欧美一区二区精品久久小说 | 亚洲色欲色欲www| 国产一区在线视频播放| 亚洲精品一品区二品区三品区| 日韩一级视频在线| 久久国产视屏| 国产精品一区二区不卡| 亚洲精品国产精品国自产网站按摩| 国产69精品福利视频| 久久青草欧美一区二区三区| 午夜看片在线| 国产精品一区一区三区| 欧美3级在线| 精品国产二区三区| 自拍偷在线精品自拍偷无码专区| 欧美日韩偷拍一区| 中文字幕在线播放一区| 中文字幕欧美久久日高清| 欧美精品国产一区二区| 午夜av男人的天堂| 91精品国产九九九久久久亚洲| 国产麻豆一区二区三区精品| 欧美日韩国产影院| 亚洲欧洲日韩在线| 精品国产乱码久久久久久久久 | 国产精品视频一区二区三| 日本中文字幕一区| 夜夜精品视频一区二区| 夜夜爱av| 一区二区在线视频免费观看| 91av一区二区三区| 国产欧美一区二区三区免费| 欧美在线一区二区视频| 国产69精品久久久久app下载| 国产午夜伦理片| 亚洲欧美中日精品高清一区二区| 日韩av视屏在线观看| 国产精品亚洲一区二区三区| 99国产精品久久久久99打野战 | 国产1区2区视频| 亚洲国产精品一区二区久久hs| 91精品美女| 欧美系列一区二区| 91麻豆精品国产91久久久久推荐资源 | 少妇自拍一区| 欧美午夜精品一区二区三区| 91avpro| 91看片app| 99久久婷婷国产综合精品草原| 日韩免费一级视频| 国产精品电影免费观看| 综合久久一区| 国产视频精品久久| 91精品资源| 91影视一区二区三区| 久久国产欧美日韩精品| 老太脱裤子让老头玩xxxxx| 91人人爽人人爽人人精88v| 精品国产1区2区3区| 欧美精品粉嫩高潮一区二区| 国产日韩欧美一区二区在线播放| 欧美在线播放一区| 日本一区中文字幕| 久久国产精彩视频| 91一区二区三区在线| 蜜臀久久精品久久久用户群体| 日本少妇高潮xxxxⅹ| 国产精品一二三区视频网站| 日韩一区免费| 伊人av中文av狼人av| 欧美日韩偷拍一区| 亚洲国产精品肉丝袜久久| 国产午夜精品一区二区三区最新电影| 日本午夜久久| 97久久精品人人做人人爽| 91精品啪在线观看国产| 亚洲1区2区3区4区| 国产精品久久亚洲7777| 久久国产精品-国产精品| 高清国产一区二区三区| 亚洲精品国产一区| 色噜噜狠狠一区二区| 国产精品一区一区三区| 日本一区欧美| 国产伦高清一区二区三区| 欧美资源一区| 亚洲国产日韩综合久久精品| 国模一区二区三区白浆| 欧美日韩一区二区三区在线播放| 91久久久久久亚洲精品禁果| 偷拍自中文字av在线| 日韩av不卡一区| 久久久精品99久久精品36亚| 国产伦精品一区二区三| 日本aⅴ精品一区二区三区日| 国产一级二级在线| 久久精品国产久精国产| 国产馆一区二区| 久久精品麻豆| 狠狠色很很在鲁视频| 亚洲精品97久久久babes| xxxx在线视频| 欧美三区二区一区| 国产的欧美一区二区三区| 国产全肉乱妇杂乱视频在线观看| 少妇厨房与子伦在线观看| 2023国产精品自产拍在线观看| 国产精品高潮呻吟久| 精品国产品香蕉在线| 日韩av在线影视| 91亚洲精品国偷拍| 精品久久久久久中文字幕大豆网 | 欧美精品一区二区久久久| 久久久久久久久久国产精品| 久久一级精品视频| 97人人澡人人爽91综合色| 欧洲国产一区| 国产一级片自拍| 亚洲国产精品入口| 亚洲精品久久在线| 91九色精品| xoxoxo亚洲国产精品| 国产精品欧美日韩在线| 李采潭伦理bd播放| 素人av在线| 狠狠色噜噜狠狠狠狠88| 日本看片一区二区三区高清| 亚洲欧洲日韩在线| 欧美久久精品一级c片| 国产精品久久久久久亚洲调教| 亚洲精品久久久久久久久久久久久久| 国产欧美日韩亚洲另类第一第二页| 91久久国产露脸精品国产 | 海量av在线| 日韩欧美一区二区在线视频| 精品一区欧美| 欧美一区二区免费视频| 中文字幕在线播放一区| 97人人澡人人添人人爽超碰| 中文文精品字幕一区二区| 午夜特片网| 中文在线√天堂| 欧美精品国产一区二区| 久久精品一| 欧美高清视频一区二区三区| 欧美一级日韩一级| 欧美午夜一区二区三区精美视频| 国产91综合一区在线观看| 精品一区欧美| 国产精品久久久久久久久久久新郎 | 2018亚洲巨乳在线观看| 蜜臀久久精品久久久用户群体| 欧美日韩国产在线一区二区三区| 国产精品v欧美精品v日韩| 亚洲欧洲一区二区| 欧美一区二区三区免费看| 91精品久久久久久久久久| 国产精品v一区二区三区| 少妇又紧又色又爽又刺激视频网站| 亚洲精品久久久久中文第一暮| 91热精品| 免费精品一区二区三区视频日产| 国产精品美女久久久免费| 国产91久久久久久久免费| 日韩精品久久久久久久酒店| 欧美综合在线一区| 一级久久久| 国产欧美亚洲精品| 久久99精| 午夜叫声理论片人人影院| 国产精品第157页| 狠狠色噜噜狠狠狠狠奇米777| 国产一区第一页| 午夜老司机电影| 国产理论一区| 一区二区三区欧美视频| 狠狠躁狠狠躁视频专区| 亚洲精品性| 欧美亚洲精品一区二区三区| 首页亚洲欧美制服丝腿| 欧美日韩偷拍一区| 国模一区二区三区白浆| 国产精品一区二区久久乐夜夜嗨| 68精品国产免费久久久久久婷婷| 国产乱xxxxx97国语对白| 在线国产91|