日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種WEB聚焦搜索系統(tǒng)的搜索方法在審

專利信息
申請(qǐng)?zhí)枺?/td> 201310159265.1 申請(qǐng)日: 2013-05-03
公開(kāi)(公告)號(hào): CN103226609A 公開(kāi)(公告)日: 2013-07-31
發(fā)明(設(shè)計(jì))人: 陳志德;林抒旻;許力 申請(qǐng)(專利權(quán))人: 福建師范大學(xué)
主分類號(hào): G06F17/30 分類號(hào): G06F17/30
代理公司: 福州君誠(chéng)知識(shí)產(chǎn)權(quán)代理有限公司 35211 代理人: 戴雨君
地址: 350007 *** 國(guó)省代碼: 福建;35
權(quán)利要求書(shū): 查看更多 說(shuō)明書(shū): 查看更多
摘要:
搜索關(guān)鍵詞: 一種 web 聚焦 搜索 系統(tǒng) 方法
【說(shuō)明書(shū)】:

技術(shù)領(lǐng)域

發(fā)明涉及一種計(jì)算機(jī)網(wǎng)絡(luò)搜索引擎的技術(shù)領(lǐng)域,特別是涉及一種WEB聚焦搜索系統(tǒng)的搜索方法。

背景技術(shù)

在如今的網(wǎng)絡(luò)世界,隨著各種B2C、C2C、B2B的網(wǎng)站的成長(zhǎng)和各種測(cè)評(píng)網(wǎng)站的建設(shè)。足不出戶的網(wǎng)絡(luò)購(gòu)物已然成為大家生活中的一部分。現(xiàn)代搜索引擎,主要是指通用搜索引擎,如Google,百度、Yahoo等,能夠整合大量的信息,在用戶通過(guò)搜索引擎搜索的時(shí)候以極快的速度查詢數(shù)據(jù)庫(kù),并將結(jié)果返回給用戶。用戶能夠觸及的信息量成倍的增長(zhǎng),相應(yīng)的網(wǎng)絡(luò)上的信息量也爆炸似的增加。現(xiàn)代搜索引擎具有很高的通用性,可是它也遇到了它的瓶頸。眾所周知,通用搜索引擎雖然具有很高的通用性,可是通用性越高,搜索到的相應(yīng)的信息也就越繁雜與冗余,需要花費(fèi)用戶大量的時(shí)候用于篩選有用的信息,帶來(lái)大量的時(shí)間浪費(fèi)與人力浪費(fèi)。當(dāng)為了搜索有價(jià)值的信息付出的代價(jià)越來(lái)越高,用戶渴望搜索引擎能夠更準(zhǔn)確地滿足搜索條件,不過(guò)因?yàn)樗阉饕孀陨淼牟蛔悖沟糜脩粼谒阉饕恍┨囟ㄐ畔⒌臅r(shí)候不樂(lè)于使用它們,因?yàn)樗鼈兯阉鞒鰜?lái)的結(jié)果泛而且雜,可以說(shuō)并沒(méi)有幫用戶減少工作量。

聚焦搜索便是其中一種傳統(tǒng)搜索引擎的新競(jìng)爭(zhēng)者。聚焦搜索通過(guò)使用具有定向抓取相關(guān)網(wǎng)頁(yè)資源的聚焦爬蟲(chóng),根據(jù)既定的抓取目標(biāo),有選擇的訪問(wèn)萬(wàn)維網(wǎng)上的網(wǎng)頁(yè)與相關(guān)的鏈接,獲取所需要的信息,以提高搜索質(zhì)量。與通用搜索引擎不同,聚焦爬蟲(chóng)并不追求大的覆蓋,而是只抓取與主題內(nèi)容有關(guān)的網(wǎng)頁(yè),為用戶提供特定的搜索結(jié)果。使用聚焦搜索,可以有效地提取和利用這些信息與資源。所以聚焦搜索以其特有的能力補(bǔ)充著通用搜索引擎所無(wú)法完成的用戶需求,聚焦搜索引擎是順應(yīng)時(shí)代的產(chǎn)物。

最常見(jiàn)的聚焦爬蟲(chóng)的策略便是使用深度優(yōu)先搜索算法和廣度優(yōu)先搜索算法;這兩個(gè)搜索算法能夠很全面的覆蓋所有的頁(yè)面,可是相應(yīng)的工作量也是巨大的,而且鏈接之間常常存在著環(huán)路,容易多次搜索同一個(gè)頁(yè)面導(dǎo)致做了很多無(wú)用功,并且當(dāng)爬取商城這樣的具有巨大規(guī)模的數(shù)據(jù)庫(kù)的時(shí)候很難有所收獲,抓取的信息準(zhǔn)確率也不高,難以對(duì)用戶的判斷有價(jià)值。Xpath指的是XML路徑語(yǔ)言(XML?Path?Language),它是一種用來(lái)確定XML文檔某個(gè)位置的語(yǔ)言。XPath基于XML的樹(shù)狀結(jié)構(gòu),提供在數(shù)據(jù)結(jié)構(gòu)樹(shù)中找尋節(jié)點(diǎn)的能力。Xpath可以唯一的確定一個(gè)位置,也可以選擇具有某一類特征的位置。ArrayList就是動(dòng)態(tài)數(shù)組,用MSDN中的說(shuō)法,就是Array的復(fù)雜版本,它提供了動(dòng)態(tài)的增加和減少元素,實(shí)現(xiàn)了ICollection和IList接口,靈活的設(shè)置數(shù)組的大小等好處;每個(gè)?ArrayList?實(shí)例都有一個(gè)容量。該容量是指用來(lái)存儲(chǔ)列表元素的數(shù)組的大小。它總是至少等于列表的大小。隨著向?ArrayList?中不斷添加元素,其容量也自動(dòng)增長(zhǎng)。

發(fā)明內(nèi)容

本發(fā)明的目的在于提供一種使WEB聚焦搜索系統(tǒng)的搜索速度更快、爬取頁(yè)面信息更準(zhǔn)確的搜索方法;

本發(fā)明采用以下方法,其包括以下步驟:

1)?設(shè)定爬蟲(chóng)程序包括網(wǎng)頁(yè)搜集線程和網(wǎng)頁(yè)處理線程;

2)?設(shè)定網(wǎng)頁(yè)搜集線程只搜索電子商務(wù)網(wǎng)站的網(wǎng)絡(luò)地址鏈接域名

3)?用戶選定主題關(guān)鍵詞,爬蟲(chóng)程序啟動(dòng)網(wǎng)頁(yè)搜集線程搜索電子商務(wù)網(wǎng)站上與主題關(guān)鍵詞一致的網(wǎng)絡(luò)地址鏈接;

4)?建立哈希表,對(duì)當(dāng)前網(wǎng)頁(yè)搜集線程搜索到的網(wǎng)頁(yè)的網(wǎng)絡(luò)地址鏈接與哈希表內(nèi)的網(wǎng)絡(luò)地址鏈接進(jìn)行比對(duì),如果搜索發(fā)現(xiàn)哈希表中不存在該網(wǎng)絡(luò)地址鏈接,則將該網(wǎng)絡(luò)地址鏈接存入哈希表,否則丟棄該網(wǎng)絡(luò)地址鏈接;

5)?利用ArrayList結(jié)構(gòu)建立網(wǎng)絡(luò)地址臨時(shí)保存的鏈接緩沖池,網(wǎng)頁(yè)搜集線程將存入哈希表的該網(wǎng)絡(luò)地址鏈接同時(shí)存入待爬取的鏈接緩沖池中;

6)?所述的網(wǎng)頁(yè)搜集線程繼續(xù)搜索電子商務(wù)網(wǎng)站上下一個(gè)與主題關(guān)鍵詞一致的網(wǎng)絡(luò)地址鏈接,直至所述的網(wǎng)頁(yè)搜集線程搜索完電子商務(wù)網(wǎng)站上與關(guān)鍵主題詞一致的所有網(wǎng)絡(luò)地址鏈接,并存入鏈接緩沖池中待爬取;

7)?爬蟲(chóng)程序啟動(dòng)網(wǎng)頁(yè)處理線程,所述的網(wǎng)頁(yè)處理線程通過(guò)DOM(文件對(duì)象模型)將所有鏈接緩沖池中待爬取的網(wǎng)絡(luò)地址鏈接的頁(yè)面映射成一個(gè)由層次節(jié)點(diǎn)組成的文件,所述的層次節(jié)點(diǎn)包括文本節(jié)點(diǎn)以及圖片鏈接節(jié)點(diǎn);所述的網(wǎng)頁(yè)處理線程利用Xpath表達(dá)式將圖片鏈接結(jié)點(diǎn)的位置表示出來(lái),然后通過(guò)文檔解析器提取該頁(yè)面中圖片鏈接以及與主題關(guān)鍵字一致的文本節(jié)點(diǎn)的文字信息,所述的網(wǎng)頁(yè)處理線程爬取一條網(wǎng)絡(luò)地址鏈接的頁(yè)面后,鏈接緩沖池中對(duì)應(yīng)的網(wǎng)絡(luò)地址鏈接被刪除;

8)?建立數(shù)據(jù)庫(kù),將網(wǎng)頁(yè)處理線程爬取的所有頁(yè)面中的圖片鏈接以及與主題關(guān)鍵字一致的文字信息存儲(chǔ)到數(shù)據(jù)庫(kù)中,并對(duì)每一條的網(wǎng)絡(luò)地址鏈接下的圖片鏈接以及文本信息進(jìn)行分類存儲(chǔ);

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于福建師范大學(xué),未經(jīng)福建師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201310159265.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說(shuō)明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書(shū);

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 日本午夜影视| 国产91九色在线播放| 中文字幕一区二区在线播放| 久久久精品观看| 色一情一交一乱一区二区三区| 久久综合国产精品| 国产另类一区| 国产伦精品一区二区三区照片91 | 亚洲国产精品国自产拍av| 男女午夜爽爽| 老太脱裤子让老头玩xxxxx| 国产欧美日韩中文字幕| 亚洲精品一品区二品区三品区| 国产在线精品二区| 中文字幕a一二三在线| 国产一区午夜| 神马久久av| 国产一二区在线| 亚洲精品一区,精品二区| 久久国产欧美一区二区三区精品| 91精品国产九九九久久久亚洲| 亚洲午夜精品一区二区三区| 午夜国产一区二区三区| 欧美日韩一区二区三区69堂| 日本精品一二三区| 国产原创一区二区 | 综合欧美一区二区三区| 李采潭伦理bd播放| 国产欧美一区二区三区不卡高清| 美国一级片免费观看| 国产一区二区在线观| 午夜黄色大片| 欧美日韩国产专区| 色偷偷一区二区三区| 日韩av视屏在线观看| 97人人澡人人添人人爽超碰| 精品国产1区2区3区| 欧美日韩精品在线一区二区| 97视频一区| 国产女人与拘做受免费视频| 国产大片一区二区三区| 在线视频国产一区二区| 69久久夜色精品国产69乱青草| 97久久超碰国产精品| 91精品综合在线观看| 免费看性生活片| 99精品国产99久久久久久97| 91性高湖久久久久久久久_久久99| 精品久久久影院| 国产精品视频1区| 日韩中文字幕在线一区| 国产99久久久久久免费看| 欧美精品粉嫩高潮一区二区 | 午夜色大片| 国偷自产一区二区三区在线观看| 国产欧美一区二区精品性| 欧美日韩九区| 国产精品亚洲二区| 日本xxxx护士高潮hd| 国产欧美日韩中文字幕| 亚洲一二三在线| 精品久久久久一区二区| 国产精品视频99| 黄色国产一区二区| 欧美激情在线免费| 91精品视频一区二区| 国产日韩精品一区二区| 中文字幕一区二区三区免费| 日韩欧美高清一区二区| 国产乱人乱精一区二视频国产精品| 一区二区久久精品66国产精品| 久久黄色精品视频| 欧美亚洲精品suv一区| 国产jizz18女人高潮| 狠狠色噜噜狠狠狠狠777| 久久精视频| 国产一区二区高潮| 91久久综合亚洲鲁鲁五月天| 国产精品一区二区中文字幕| 欧美一区二区三区国产精品| 一区二区三区四区中文字幕| 久久亚洲精品国产日韩高潮| 91亚洲欧美强伦三区麻豆| 国产精品久久久久久久久久不蜜臀| 国产精品高潮在线| 公乱妇hd在线播放bd| 97欧美精品| 精品国产九九九 | 99精品视频一区二区| 国产精品免费自拍| 国产中文字幕一区二区三区 | 国产亚洲精品久久久久动| 亚洲欧洲另类精品久久综合| 国产精自产拍久久久久久蜜| 午夜黄色一级电影| 亚洲高清毛片一区二区| 精品一区二区三区中文字幕| 国产在线播放一区二区| 国产1区2区视频| 综合在线一区| 欧美极品少妇xxxxⅹ| 午夜电影天堂| 日本高清二区| 欧美一级不卡| 精品国产一区在线| 日韩一区免费| 国产二区三区视频| 91久久国产露脸精品| 国产一区二区三区四区五区七| 中文字幕一区二区三区四| 久精品国产| 蜜臀久久99精品久久一区二区| 国产aⅴ精品久久久久久| 久久久久久久亚洲视频| 国产精品视频一区二区在线观看 | 欧美精品免费一区二区| 91婷婷精品国产综合久久| 欧美日韩综合一区| 九九视频69精品视频秋欲浓| 免费看农村bbwbbw高潮| 亚洲欧美国产中文字幕| 国产精品对白刺激久久久| 色一情一乱一乱一区99av白浆| 亚洲一区欧美| 欧美日韩久久一区二区| 国产精品久久久不卡| 岛国精品一区二区| 久久夜色精品国产亚洲| 国产69精品久久久久9999不卡免费 | 欧美777精品久久久久网| 97精品国产97久久久久久粉红| 欧美亚洲视频一区二区| 青苹果av| 精品国产乱码一区二区三区a | 97人人揉人人捏人人添| 麻豆精品一区二区三区在线观看| 亚洲欧美一区二区三区1000| 国产精品久久久久久久久久久新郎| 国产精品19乱码一区二区三区 | 日本久久丰满的少妇三区| 国产婷婷色一区二区三区在线| 国产精品久久久视频| 精品久久久久久亚洲综合网| 日本精品三区| 强制中出し~大桥未久在线播放| 91久久久久久亚洲精品禁果| 久久久综合香蕉尹人综合网| 久久综合久久自在自线精品自| 国产乱人伦精品一区二区| 国产乱子伦农村xxxx| 中文字幕一区二区三区日韩精品| 亚洲精欧美一区二区精品| 欧美精品中文字幕在线观看| 欧美在线观看视频一区二区三区| 欧美freesex极品少妇| 538国产精品一区二区| 强行挺进女警紧窄湿润| 欧美在线视频三区| 99国产精品久久久久老师| av素人在线| 欧美日韩国产123| 97人人模人人爽视频一区二区 | 欧美一区二区三区三州| 香港三日本8a三级少妇三级99| 欧美中文字幕一区二区| 国产免费一区二区三区四区五区| 中文字幕av一区二区三区高| 免费毛片**| 日韩av中文字幕在线免费观看| 国产精品96久久久| 国产精品伦一区二区三区级视频频| 久久99精品一区二区三区| 欧美中文字幕一区二区| 国产精品欧美久久| 欧美极品少妇videossex| 香蕉视频在线观看一区二区| 久久一区二区三区视频| 欧美一区二区三区白人| 99精品久久久久久久婷婷| 国产精品视频久久久久久| 国产一区二区激情| 99国精视频一区一区一三| 国产精品二区一区二区aⅴ| 国产精品高潮呻吟三区四区| 99精品一级欧美片免费播放| 欧美一区二区三区久久久久久桃花 | 亚洲国产精品入口| 护士xxxx18一19| 国产高清在线一区| 亚洲精品乱码久久久久久按摩| 欧美日韩一级黄| 精品国产鲁一鲁一区二区作者| 国产69精品久久久久9999不卡免费 | 免费的午夜毛片| 91精品视频一区二区| 欧美午夜羞羞羞免费视频app| 手机看片国产一区| 国产无遮挡又黄又爽免费网站| 国产欧美一区二区三区免费看| 精品一区二区在线视频| 中文字幕亚洲欧美日韩在线不卡| 国产精品偷拍| 国产在线精品一区| 欧美一区二区三区另类| 国产老妇av| 自拍偷在线精品自拍偷写真图片| 国产日韩欧美网站| 日韩精品少妇一区二区在线看| 国产女性无套免费看网站| 国产剧情在线观看一区二区| 亚洲久色影视| 午夜生活理论片| 精品国产一区二区三区在线| 欧美大片一区二区三区| 国产精品视频一区二区在线观看| 亚洲欧美日本一区二区三区| 夜夜躁人人爽天天天天大学生 | 亚洲欧美国产精品一区二区| 日本一区午夜艳熟免费| 97香蕉久久国产超碰青草软件| 国产精品国产一区二区三区四区| 国产一区二区激情| 国产69精品久久久久999小说| 伊人久久婷婷色综合98网| 国产一区二三| 精品国产九九| 97精品超碰一区二区三区| 少妇中文字幕乱码亚洲影视| 一级女性全黄久久生活片免费| 国产精品乱码久久久久久久 | 国产精品久久人人做人人爽| 日韩av免费网站| 日韩一区二区三区福利视频| 亚洲国产精品区| 理论片高清免费理伦片| 国产视频一区二区不卡 | 日本道欧美一区二区aaaa| 日本一区二区三区在线看| 国产呻吟久久久久久久92| 亚洲一二区在线观看| sb少妇高潮二区久久久久| 国产一区二区三区国产| 国产一区日韩在线| 88国产精品欧美一区二区三区三| 日本一区二区三区在线视频| 国产九九影院|