日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種云環(huán)境中的文本索引在線更新方法有效

專利信息
申請?zhí)枺?/td> 201010554536.X 申請日: 2010-11-19
公開(公告)號: CN102004778A 公開(公告)日: 2011-04-06
發(fā)明(設(shè)計(jì))人: 王建民;丁貴廣;張君 申請(專利權(quán))人: 清華大學(xué)
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 北京清亦華知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11201 代理人: 羅文群
地址: 100084*** 國省代碼: 北京;11
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 環(huán)境 中的 文本 索引 在線 更新 方法
【說明書】:

技術(shù)領(lǐng)域

發(fā)明涉及一種云環(huán)境中的文本索引在線更新方法,屬于計(jì)算機(jī)信息檢索技術(shù)領(lǐng)域。

背景技術(shù)

互聯(lián)網(wǎng)和企業(yè)信息化的發(fā)展,產(chǎn)生了大量的非結(jié)構(gòu)化數(shù)據(jù),如產(chǎn)品模型、技術(shù)文檔、管理文本、電子郵件等,文本數(shù)據(jù)就是最常見的非結(jié)構(gòu)化數(shù)據(jù)之一。為了實(shí)現(xiàn)海量數(shù)據(jù)的存儲、索引和檢索,許多的文本檢索系統(tǒng)都采用了云計(jì)算方案。網(wǎng)絡(luò)文本搜索引擎是一類最常見的提供文本檢索服務(wù)的應(yīng)用,如Google和Nutch。

在云環(huán)境中,索引數(shù)據(jù)一般被切分成許多的索引片,然后部署在集群中,每個(gè)節(jié)點(diǎn)持有其中部分索引片,每個(gè)索引片一般都有多個(gè)備份來保證容錯(cuò)性和負(fù)載平衡。許多采用云計(jì)算方案的文本檢索系統(tǒng)表現(xiàn)出了優(yōu)異的索引和檢索性能,卻忽略了索引的即時(shí)性要求。它們假設(shè)文本數(shù)據(jù)索引在一段時(shí)間內(nèi)是不變的,因此采取批量更新索引的方法,在一段時(shí)間內(nèi)持續(xù)對新到來的數(shù)據(jù)進(jìn)行索引,定期地將新索引數(shù)據(jù)批量更新到集群中,其索引數(shù)據(jù)更新周期一般比較長。

對于云環(huán)境的文本檢索系統(tǒng)來說,用戶要求將隨時(shí)到來的新文檔在盡可能短的時(shí)間內(nèi)更新到索引中,傳統(tǒng)的批量更新方法無法滿足用戶的需求。高度的精確性和時(shí)效性要求,使得其索引管理與更新成為一個(gè)重點(diǎn),也是一個(gè)難點(diǎn)。

索引的在線更新就是在此環(huán)境下提出來的。它要求文本檢索系統(tǒng)能夠在不影響其他索引數(shù)據(jù)、不中止檢索服務(wù)的情況下進(jìn)行指定索引數(shù)據(jù)的更新。不過,在多數(shù)情況下,索引更新都會(huì)導(dǎo)致一定時(shí)間的服務(wù)中斷;而在線更新的目標(biāo)就是,將服務(wù)中斷的時(shí)間盡可能地縮短。

Mauricio?Marin等人設(shè)計(jì)了一個(gè)支持在線更新的文本搜索引擎。該搜索引擎允許用戶執(zhí)行檢索操作及添加文本的操作。添加的文本被索引后,索引數(shù)據(jù)發(fā)送到相應(yīng)節(jié)點(diǎn)進(jìn)行更新。該系統(tǒng)通過索引讀寫的并發(fā)控制來避免讀寫沖突。但是該系統(tǒng)并沒有對索引做冗余備份,無法提供可靠的索引服務(wù)和負(fù)載平衡。對于每個(gè)新文本,該系統(tǒng)都直接添加到索引數(shù)據(jù)中;在許多這樣的請求同時(shí)發(fā)生的時(shí)候,節(jié)點(diǎn)就需要頻繁地更新同一索引,導(dǎo)致CPU的過度繁忙;而對索引讀寫的并發(fā)控制使得用戶此時(shí)的檢索請求得不到及時(shí)的響應(yīng)。

Mark?H.Butler和James?Rutherford開發(fā)的Distributed?Lucene也是一個(gè)支持索引在線更新的分布式文本索引系統(tǒng)。該系統(tǒng)采用了lease機(jī)制來實(shí)現(xiàn)索引的并發(fā)控制,當(dāng)一個(gè)節(jié)點(diǎn)更新其索引備份時(shí),該節(jié)點(diǎn)必須先獲得該索引的lease。用戶向一個(gè)索引中增加或刪除文檔時(shí),需要為該索引創(chuàng)建一個(gè)Uncommited?IndexVersion,操作完成后顯式地將其提交。但是對于一個(gè)索引只能創(chuàng)建一個(gè)Uncommited?IndexVersion,這就使得并發(fā)用戶不得不等待前面用戶的操作完成,影響了并發(fā)的效率。另外,該系統(tǒng)中的索引操作是在節(jié)點(diǎn)中執(zhí)行的,用戶需要將原始文本傳送到節(jié)點(diǎn)上;因?yàn)槲谋镜乃饕鄬τ谠嘉谋緛碚f一般比較小,這樣的設(shè)計(jì)會(huì)導(dǎo)致較大的網(wǎng)絡(luò)帶寬資源浪費(fèi)。

傳統(tǒng)的索引批量更新方法一般是,首先在一定時(shí)間內(nèi)持續(xù)地創(chuàng)建新索引數(shù)據(jù),等到創(chuàng)建完成,將集群內(nèi)的原始數(shù)據(jù)全部刪除,然后再將新的索引數(shù)據(jù)部署到集群中,從而啟動(dòng)新索引數(shù)據(jù)的檢索服務(wù)。這種方法存在著較多的缺點(diǎn):

一方面,批量更新一般需要重建全部索引,然后將新的索引數(shù)據(jù)部署到集群中,這將導(dǎo)致極大的數(shù)據(jù)傳輸量,因此占用很多的網(wǎng)絡(luò)帶寬和計(jì)算資源,執(zhí)行時(shí)間也會(huì)很長,隨著索引越來越大,對資源的需求將越來越高,成為系統(tǒng)的瓶頸。

另一方面,批量更新一般需要將原索引數(shù)據(jù)刪除,然后再執(zhí)行索引的更新。在索引的更新期間,系統(tǒng)必將停止檢索服務(wù)。如果更新時(shí)間較長,那么必然導(dǎo)致系統(tǒng)長時(shí)間無法提供服務(wù)。

發(fā)明內(nèi)容

本發(fā)明的目的是提出一種云環(huán)境中的文本索引在線更新方法,針對已有技術(shù)中批量更新的不足,設(shè)計(jì)了在線更新機(jī)制、索引片增量的緩存機(jī)制等,以保證并發(fā)更新的一致性,并避免索引的頻繁更新,降低帶寬資源和計(jì)算資源的占用。

本發(fā)明提出的云環(huán)境中的文本索引在線更新方法,包括以下步驟:

(1)在用戶向文本檢索系統(tǒng)添加、刪除或更新文件后,將該文件的識別信息發(fā)送至索引模塊;索引模塊根據(jù)文本檢索系統(tǒng)中定義的索引切分規(guī)則,對接收的識別信息進(jìn)行判斷,確定該文件所屬的索引片,并為該文件創(chuàng)建一個(gè)與該索引片相對應(yīng)的增量數(shù)據(jù);索引模塊將該增量數(shù)據(jù)緩存,并對相同索引片的多次添加、刪除或更新產(chǎn)生的增量數(shù)據(jù)合并;當(dāng)用戶結(jié)束添加、刪除或更新操作后,索引模塊將所有的索引片增量數(shù)據(jù)上傳到共享文件系統(tǒng)中;索引模塊向文本檢索系統(tǒng)中的集群主節(jié)點(diǎn)發(fā)出索引片更新命令,該命令中包括:每個(gè)被更新索引片的名稱、增量類型、增量的存儲路徑;

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于清華大學(xué),未經(jīng)清華大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201010554536.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产在线播放一区二区| 久久综合伊人77777麻豆| 国产69精品99久久久久久宅男| 国产精品久久久区三区天天噜| 一区二区国产精品| 日本高清二区| 性刺激久久久久久久久九色| 国产一区在线精品| 亚洲精品日韩精品| 欧美在线视频一区二区三区| 日韩午夜毛片| 中文字幕av一区二区三区四区| 国产日韩欧美专区| 国产精品久久久久久久久久久新郎| 日韩av一区二区在线播放| 性色av香蕉一区二区| 久久精品欧美一区二区| 日韩夜精品精品免费观看| 午夜看片在线| 丝袜美腿诱惑一区二区| 国产欧美日韩精品一区二区三区| 国产精品尤物麻豆一区二区三区| 日韩精品一区二区av| 日本一二三不卡| 国产视频精品一区二区三区| 狠狠色很很在鲁视频| 国产精品久久久久久久久久久久久久不卡| 黄色国产一区二区| 国产一区二区三区的电影| 国产大片一区二区三区| 国产人成看黄久久久久久久久| 国产精品入口麻豆九色| 中文字幕欧美久久日高清| 国产农村妇女精品一二区| 日韩欧美一区二区久久婷婷| 国产欧美一区二区三区精品观看| 国产清纯白嫩初高生视频在线观看| 欧美日韩久久一区| 欧美在线视频一区二区三区| 午夜激情电影院| 国产中文字幕91| 亚洲国产午夜片| 久久久精品观看| 激情久久一区二区三区| 国产乱淫精品一区二区三区毛片| 久久人做人爽一区二区三区小说| 91丝袜国产在线观看| 亚洲欧美一二三| 蜜臀久久精品久久久用户群体| freexxxx性| 国产精品一区二区久久乐夜夜嗨| 狠狠色依依成人婷婷九月| free性欧美hd另类丰满| 国产丝袜一区二区三区免费视频| 国产在线一卡| 国产一区二区三区四区五区七| 99久久免费毛片基地| 欧美日韩中文不卡| 一级午夜影院| 午夜亚洲影院| 欧美日韩激情在线| 日韩欧美激情| 免费超级乱淫视频播放| 91嫩草入口| 国产午夜三级一二三区| 国产欧美日韩一区二区三区四区| 91免费视频国产| 亚洲高清国产精品| 四季av中文字幕一区| 精品综合久久久久| 午夜影院试看五分钟| 国产精品国产三级国产专区53| 日韩午夜三级| 色婷婷噜噜久久国产精品12p | 欧美极品少妇videossex| 88国产精品欧美一区二区三区三| 久久中文一区| 一区二区在线不卡| 国产69久久久欧美一级| 欧美一级免费在线视频| 一二三区欧美| 精品国产九九九| 午夜激情综合网| 夜夜精品视频一区二区| www亚洲精品| 欧美人妖一区二区三区| 精品国产亚洲一区二区三区| 亚洲精品久久久久玩吗| 91精品国模一区二区三区| 亚洲国产精品国自产拍久久| 国产精选一区二区| 国产精品久久国产精品99 | 一区二区三区免费高清视频| 日韩av在线电影网| 91免费看国产| 午夜国产一区二区三区四区| 草逼视频网站| 亚欧精品在线观看| 狠狠色狠狠色很很综合很久久| 91精品一区在线观看| 亚洲高清毛片一区二区| 国产电影一区二区三区下载| 天天干狠狠插| 爽妇色啪网| 亚洲福利视频一区| 欧美高清性xxxx| 国产伦精品一区二| 日韩av中文字幕一区二区| 少妇中文字幕乱码亚洲影视| 亚洲少妇一区二区三区| 国产精品视频十区| 91视频一区二区三区| 欧美日韩亚洲国产一区| 国产一区二区高清视频| 亚洲精品一品区二品区三品区| 国产一区二区视频在线| 一区二区三区欧美日韩| 性色av香蕉一区二区| 国产精品视频1区| 91精品视频一区二区三区| 麻豆精品一区二区三区在线观看| 欧美日韩精品在线播放| 亚洲精品国产精品国产| 黄色香港三级三级三级| 91精品国产综合久久国产大片| 欧美国产一区二区在线| 狠狠综合久久av一区二区老牛| 日本一区午夜艳熟免费| 国产天堂一区二区三区| 中文字幕一区二区三区四| 国产精品综合久久| 玖玖爱国产精品| 爽妇色啪网| 91麻豆精品国产综合久久久久久| 中文在线一区| 亚洲欧美另类综合| 国产1区2区3区| ass美女的沟沟pics| 7799国产精品久久99| 欧美日韩一级二级| 国产88在线观看入口| 国产理论片午午午伦夜理片2021| 久久网站精品| 性欧美1819sex性高播放| 亚洲国产精品日本| 99久久99精品| 国产一区二区三区小说| 国产不卡三区| 夜色av网站| 久久一区二| 自拍偷在线精品自拍偷无码专区| 午夜激情在线| 性old老妇做受| 91偷拍网站| 亚洲va久久久噜噜噜久久0| 久久久精品久久日韩一区综合| 久久99精品国产麻豆婷婷洗澡| 国产亚洲精品久久久久动| 一区二区三区国产精华| 亚洲精品456在线播放| 国产精品v欧美精品v日韩精品v| 国产二区视频在线播放| 午夜影院毛片| 国产精品香蕉在线的人| 午夜爽爽爽男女免费观看| 国产在线一区观看| 亚洲欧美日韩在线| 国精偷拍一区二区三区| 国产在线观看免费麻豆| 好吊色欧美一区二区三区视频| 精品久久久久久中文字幕| 国产精品理人伦一区二区三区| 午夜看片在线| 性色av色香蕉一区二区三区| 色妞妞www精品视频| 少妇中文字幕乱码亚洲影视| 激情久久综合| 欧美日韩激情一区二区| sb少妇高潮二区久久久久| 91精品视频一区二区三区| 国产精品不卡在线| 国产999精品视频| 午夜免费网址| 欧美日韩久久一区二区| 国产精品1234区| 欧美激情精品一区| 久久久99精品国产一区二区三区| 国产又色又爽无遮挡免费动态图| 欧美高清性xxxx| 亚洲乱码av一区二区三区中文在线: | 91久久国产视频| 偷拍自中文字av在线| 久久网站精品| 精品少妇的一区二区三区四区| 欧美精品一区二区性色| 亚洲国产精品一区在线观看| 久久午夜鲁丝片| 国产精品视频1区| aaaaa国产欧美一区二区| 亚洲欧洲国产伦综合| 九色国产精品入口| 国产白丝一区二区三区| 欧美一区二区精品久久911| 亚洲一区二区福利视频| 91精品国产综合久久国产大片| 欧美在线视频三区| 最新日韩一区| 免费的午夜毛片| 亚洲高清毛片一区二区| 精品国产九九九 | 久久99精品国产99久久6男男| 国久久久久久| 欧美激情图片一区二区| 亚洲高清毛片一区二区| 国产精品久久久久久久久久久久久久久久| 亚洲欧美国产日韩色伦| 国产精品一二三区视频出来一| 男人的天堂一区二区| 国产一区三区四区| 国产91视频一区| 99国产精品9| 2023国产精品久久久精品双| 国产第一区在线观看| 国内久久久久久| 免费午夜在线视频| 麻豆天堂网| 高清在线一区二区| 国产精品一区二区免费| 狠狠色狠狠色合久久伊人| 国产精品一区二区三| 最新国产一区二区| 在线精品国产一区二区三区88| 制服丝袜二区| 欧美色综合天天久久综合精品| 国产欧美综合一区| 激情久久综合| 999久久久国产| av中文字幕一区二区| 国产在线一区二区视频| 9999国产精品| 亚洲国产精品精品| 精品国产乱码一区二区三区在线 | 国产精品v欧美精品v日韩精品v | 99久久婷婷国产精品综合| 国模精品免费看久久久| 亚洲午夜精品一区二区三区电影院|