[發(fā)明專利]使冗余最小化的Web饋送聚合方法有效
| 申請(qǐng)?zhí)枺?/td> | 200980118076.1 | 申請(qǐng)日: | 2009-04-09 |
| 公開(kāi)(公告)號(hào): | CN102037465A | 公開(kāi)(公告)日: | 2011-04-27 |
| 發(fā)明(設(shè)計(jì))人: | P·雅博;G·比爾恩西德 | 申請(qǐng)(專利權(quán))人: | 阿爾卡特朗訊 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京市金杜律師事務(wù)所 11256 | 代理人: | 王茂華 |
| 地址: | 法國(guó)*** | 國(guó)省代碼: | 法國(guó);FR |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 冗余 最小化 web 饋送 聚合 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及Web饋送(feed)的聚合。
背景技術(shù)
自從開(kāi)始于20世紀(jì)90年代早期起,萬(wàn)維網(wǎng)(World?Wide?Web)已經(jīng)變得非常流行,它現(xiàn)在包括數(shù)以億計(jì)的Web頁(yè)面,這些Web頁(yè)面包括諸如文本、圖像、視頻以及去往其他Web頁(yè)面的鏈接(也稱為超鏈接)等各種內(nèi)容。數(shù)以億計(jì)的Web沖浪者每天在使用著萬(wàn)維網(wǎng)。
現(xiàn)在,上線是非常簡(jiǎn)單的,既不需要專門技藝也不需要國(guó)家或國(guó)際機(jī)構(gòu)前的專門過(guò)程,事實(shí)上也不存在這樣的機(jī)構(gòu)。令人驚訝的是,盡管任何人都將受益于這種分類,但并沒(méi)有嘗試對(duì)Web進(jìn)行分類以便將Web站點(diǎn)按類分組(基于預(yù)定標(biāo)準(zhǔn))。因此,Web沖浪者獲取重要、可靠的更新信息變得越來(lái)越難。當(dāng)然,Web瀏覽器是有幫助的,但是隨著Web頁(yè)面的數(shù)目增加,大量語(yǔ)義搜索請(qǐng)求得到的是未加工的內(nèi)容,這些內(nèi)容大多數(shù)未經(jīng)分類,常常是冗余的,不明確的,最后簡(jiǎn)單來(lái)說(shuō),是沒(méi)有用的。
在21世紀(jì)的早些時(shí)候,提出了一種稱為聯(lián)合(syndication)的解決方案,以幫助沖浪者在正確的時(shí)刻得到正確的信息。在聯(lián)合中,一個(gè)Web站點(diǎn)的部分可用于其他Web站點(diǎn)。更具體地,在Web聯(lián)合中,內(nèi)容(通常稱為Web饋送)以特定格式——通常是基于XML的格式(XML為可擴(kuò)展標(biāo)記語(yǔ)言),諸如RSS(真正簡(jiǎn)易聯(lián)合)或Atom——被置于Web站點(diǎn)上,并且與饋送鏈接相關(guān)聯(lián),另一用戶(客戶端)可以訂閱饋送鏈接,以借助于稱為饋送聚合器(也稱為饋送閱讀器或新聞閱讀器)的、在客戶端的終端或服務(wù)器上本地運(yùn)行的特定應(yīng)用來(lái)獲取相應(yīng)的內(nèi)容。
在已經(jīng)訂閱饋送的情況下,饋送聚合器可以配置用于以預(yù)定的間隔(可以是用戶定義的)檢查和獲取更新的內(nèi)容。現(xiàn)代Web瀏覽器通常包括內(nèi)置的聚合器,諸如iGoogleTM和My?YahooTM。美國(guó)專利申請(qǐng)?zhí)朥S?2008/0034058(已轉(zhuǎn)讓給Marchex公司)和US2008/0046543(已轉(zhuǎn)讓給RealNetworks)都示出了用于獲得Web饋送的方法。
盡管饋送聚合器是用于從萬(wàn)維網(wǎng)獲取更新信息并通過(guò)用戶友好的圖形接口(GUI)使其可由最終用戶獲得的強(qiáng)大資源,但是文章的量有時(shí)可能是壓倒性的,特別是當(dāng)用戶已經(jīng)訂閱了很多Web饋送時(shí)。為了解決這一問(wèn)題,某些饋送聚合器包括允許用戶利用關(guān)鍵詞為饋送添加標(biāo)簽的功能,以便將可用的文章分類和過(guò)濾到易于導(dǎo)航的類別中。然而,該方式是耗時(shí)的,因?yàn)橛脩舯仨殞?duì)他希望從其獲得更新內(nèi)容的饋送進(jìn)行預(yù)先分類。而且,當(dāng)要獲取的內(nèi)容隨著每次更新改變主題時(shí)(例如,在報(bào)紙網(wǎng)站中),為Web饋送添加標(biāo)簽是完全無(wú)用的。
發(fā)明內(nèi)容
顯然,需要一種允許Web沖浪者以完全可行的方式自動(dòng)地獲得從Web饋送獲取的信息的方案。
本發(fā)明的目的是提供這樣的方案。
由此,根據(jù)一個(gè)方面,本發(fā)明提供一種用于聚合聯(lián)合Web內(nèi)容的方法,包括步驟:
-從預(yù)定Web饋送獲取更新內(nèi)容;
-將所述更新內(nèi)容與先前獲取的已存儲(chǔ)內(nèi)容(例如,存儲(chǔ)為饋送歷史數(shù)據(jù)庫(kù)中的條目)進(jìn)行比較;
-如果認(rèn)為更新內(nèi)容不同于已存儲(chǔ)內(nèi)容,則存儲(chǔ)更新內(nèi)容;
-如果認(rèn)為更新內(nèi)容與已存儲(chǔ)內(nèi)容相同,則刪除更新內(nèi)容。
可以提供進(jìn)一步的步驟,即如下步驟:
-如果認(rèn)為更新內(nèi)容是已存儲(chǔ)內(nèi)容的補(bǔ)充,則向該已存儲(chǔ)內(nèi)容添加該更新內(nèi)容;
-計(jì)算相似性索引其表示更新內(nèi)容與已存儲(chǔ)內(nèi)容之間的相似性程度;
-將所述相似性索引與一個(gè)或多個(gè)閾值進(jìn)行比較。更具體地,將相似性索引與兩個(gè)閾值Smin和Smax進(jìn)行比較,由此
-如果相似性索引低于Smin,則認(rèn)為更新內(nèi)容不同于已存儲(chǔ)內(nèi)容;
-如果相似性索引大于Smax,則認(rèn)為更新內(nèi)容與已存儲(chǔ)內(nèi)容相同,并可以因此向已存儲(chǔ)內(nèi)容添加該更新內(nèi)容;
-如果相似性索引在Smin與Smax之間,則認(rèn)為更新內(nèi)容是已存儲(chǔ)內(nèi)容的補(bǔ)充。
根據(jù)另一方面,本發(fā)明提供一種饋送聚合器,包括:
-饋送閱讀器,配置用于檢查和獲取來(lái)自預(yù)定Web饋送的更新內(nèi)容;
-過(guò)濾模塊,配置用于管理所述更新內(nèi)容與先前獲取的已存儲(chǔ)內(nèi)容的比較;
-饋送歷史數(shù)據(jù)庫(kù),用于存儲(chǔ)內(nèi)容。
饋送聚合器還可以包括一個(gè)或多個(gè)條目分析器,其鏈接至過(guò)濾模塊,配置用于將所述更新內(nèi)容與已存儲(chǔ)內(nèi)容進(jìn)行比較。更具體地,一個(gè)或多個(gè)條目分析器可以配置用于:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿爾卡特朗訊,未經(jīng)阿爾卡特朗訊許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200980118076.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種針對(duì)ASIC設(shè)計(jì)中網(wǎng)表邏輯冗余的優(yōu)化方法及系統(tǒng)
- 可自動(dòng)恢復(fù)冗余的冗余控制系統(tǒng)及其冗余自動(dòng)恢復(fù)方法
- 一種具備冗余接口的列控車載設(shè)備
- 可自動(dòng)恢復(fù)冗余的冗余控制系統(tǒng)
- 一種監(jiān)測(cè)冗余網(wǎng)絡(luò)完整性的方法和冗余裝置
- 冗余修正電路及應(yīng)用其的冗余修正方法
- N:1有狀態(tài)應(yīng)用網(wǎng)關(guān)冗余方法、系統(tǒng)和備用服務(wù)網(wǎng)關(guān)
- 冗余網(wǎng)絡(luò)中的信息共享方法及裝置、計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 帶反饋校正的冗余結(jié)構(gòu)
- 一種冗余制動(dòng)單元及車輛
- 提供共享Web模塊的系統(tǒng)和方法
- 管理環(huán)球網(wǎng)網(wǎng)頁(yè)中的環(huán)球網(wǎng)媒體的系統(tǒng)及其實(shí)現(xiàn)方法
- 一種WEB業(yè)務(wù)實(shí)現(xiàn)系統(tǒng)、裝置及方法
- 高速緩存廣播信息的方法和裝置
- 基于QoS指標(biāo)和Web服務(wù)輸出參數(shù)的Web服務(wù)組合方法和裝置
- Web托管審查方法、裝置及Web托管系統(tǒng)
- 用于信息處理和Web瀏覽歷史導(dǎo)航的方法和設(shè)備及電子裝置
- 用于將web站點(diǎn)轉(zhuǎn)換為目標(biāo)web app站點(diǎn)的方法和裝置
- 用于防護(hù)WEB漏洞的方法和設(shè)備
- 一種Web攻擊報(bào)告生成方法、裝置、設(shè)備及計(jì)算機(jī)介質(zhì)





