[發(fā)明專利]一種確定PC網(wǎng)頁與移動(dòng)網(wǎng)頁自適應(yīng)關(guān)系的系統(tǒng)及方法在審
| 申請(qǐng)?zhí)枺?/td> | 201410838598.1 | 申請(qǐng)日: | 2014-12-29 |
| 公開(公告)號(hào): | CN104504100A | 公開(公告)日: | 2015-04-08 |
| 發(fā)明(設(shè)計(jì))人: | 王智廣;張飛虎 | 申請(qǐng)(專利權(quán))人: | 北京奇虎科技有限公司;奇智軟件(北京)有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京路浩知識(shí)產(chǎn)權(quán)代理有限公司 11002 | 代理人: | 李相雨 |
| 地址: | 100088 北京市西城區(qū)新*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 確定 pc 網(wǎng)頁 移動(dòng) 自適應(yīng) 關(guān)系 系統(tǒng) 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,具體而言,涉及一種確定PC網(wǎng)頁與移動(dòng)網(wǎng)頁自適應(yīng)關(guān)系的系統(tǒng)和一種確定PC網(wǎng)頁與移動(dòng)網(wǎng)頁自適應(yīng)關(guān)系的方法。
背景技術(shù)
隨著移動(dòng)互聯(lián)網(wǎng)產(chǎn)業(yè)的快速發(fā)展,越來越多的用戶通過手機(jī)、PAD等移動(dòng)設(shè)備上網(wǎng)越來越普遍。3G各類wap網(wǎng)站開始蓬勃發(fā)展,很多傳統(tǒng)互聯(lián)網(wǎng)網(wǎng)站都希望將自己原有的PC網(wǎng)頁移植到移動(dòng)互聯(lián)網(wǎng)中,借助手機(jī)網(wǎng)絡(luò)用戶的增長(zhǎng),繼續(xù)保持發(fā)展。但是這些移動(dòng)設(shè)備和普通電腦不同,他們的屏幕相對(duì)于普通電腦的屏幕而言是非常小巧的,在普通電腦上可以顯示的網(wǎng)頁在移動(dòng)設(shè)備上瀏覽起來用戶體驗(yàn)并不好。
對(duì)于搜索引擎而言,當(dāng)用戶采用移動(dòng)設(shè)備進(jìn)行搜索時(shí)應(yīng)該提供適合移動(dòng)設(shè)備顯示的移動(dòng)網(wǎng)頁。目前,一種方案是針對(duì)移動(dòng)網(wǎng)頁單獨(dú)建立索引庫,當(dāng)用戶采用移動(dòng)設(shè)備進(jìn)行搜索時(shí),查詢移動(dòng)索引庫并且提供移動(dòng)網(wǎng)頁。這種方案缺點(diǎn)是需要單獨(dú)建索引庫并且需要重新計(jì)算移動(dòng)網(wǎng)頁和用戶搜索詞query的相關(guān)性以及權(quán)重。另一種方案是利用移動(dòng)UA(User?Agent,用戶代理)模擬移動(dòng)設(shè)備隨機(jī)抓取大量的PC網(wǎng)頁對(duì)應(yīng)的url(Uniform?Resource?Locator,統(tǒng)一資源定位符),渲染并解析返回的網(wǎng)頁,如果為移動(dòng)網(wǎng)頁則為具有對(duì)應(yīng)關(guān)系,挖掘上述移動(dòng)網(wǎng)頁和PC網(wǎng)頁的對(duì)應(yīng)關(guān)系(調(diào)研發(fā)現(xiàn)90%以上的移動(dòng)網(wǎng)頁在PC上有對(duì)應(yīng)的PC網(wǎng)頁),當(dāng)用戶用移動(dòng)設(shè)備搜索時(shí)根據(jù)PC和移動(dòng)網(wǎng)頁的對(duì)應(yīng)關(guān)系展現(xiàn)和PC相對(duì)應(yīng)的移動(dòng)網(wǎng)頁,這種方案不需要單獨(dú)創(chuàng)建移動(dòng)索引庫,并且在出展現(xiàn)結(jié)果時(shí)根據(jù)PC網(wǎng)頁的相關(guān)性和權(quán)重直接平移到移動(dòng)網(wǎng)頁上,不需要重新計(jì)算。但是采用這種方案需要抓取大量的PC網(wǎng)頁對(duì)應(yīng)的url,而且選取哪些PC網(wǎng)頁對(duì)應(yīng)的url抓取是比較隨機(jī)的,而很多站點(diǎn)只是部分PC網(wǎng)頁有對(duì)應(yīng)的移動(dòng)網(wǎng)頁,這可能造成真正有對(duì)應(yīng)關(guān)系的PC網(wǎng)頁在選取時(shí)可能選取不到導(dǎo)致對(duì)應(yīng)關(guān)系挖掘不到,即使能夠選取到可能選取的量比較少也無法形成規(guī)則。
PC網(wǎng)頁和移動(dòng)網(wǎng)頁對(duì)應(yīng)關(guān)系分為自適應(yīng)和非自適應(yīng),自適應(yīng)指的是當(dāng)用戶利用移動(dòng)設(shè)備訪問PC網(wǎng)頁的時(shí)候站點(diǎn)自動(dòng)返回給用戶的是對(duì)應(yīng)的移動(dòng)網(wǎng)頁,非自適應(yīng)則不會(huì)。自適應(yīng)又分為跳轉(zhuǎn)和非跳轉(zhuǎn),跳轉(zhuǎn)指的是當(dāng)用戶用移動(dòng)設(shè)備訪問PC網(wǎng)頁對(duì)應(yīng)的url時(shí)站點(diǎn)返回的移動(dòng)網(wǎng)頁對(duì)應(yīng)的url和PC網(wǎng)頁對(duì)應(yīng)的url是不同的,非跳轉(zhuǎn)指的是當(dāng)用戶用移動(dòng)設(shè)備訪問PC網(wǎng)頁對(duì)應(yīng)的url時(shí)站點(diǎn)返回的移動(dòng)網(wǎng)頁對(duì)應(yīng)的url和PC網(wǎng)頁對(duì)應(yīng)的url從長(zhǎng)相上看是完全一樣的,只不過是內(nèi)容不同。
如何提供一種確定PC網(wǎng)頁與移動(dòng)網(wǎng)頁自適應(yīng)關(guān)系的方法,能夠準(zhǔn)確地利用少量的PC網(wǎng)頁和移動(dòng)網(wǎng)頁,挖掘較全面的PC網(wǎng)頁和移動(dòng)網(wǎng)頁的自適應(yīng)對(duì)應(yīng)關(guān)系,降低PC網(wǎng)頁向移動(dòng)網(wǎng)頁轉(zhuǎn)化過程中所花費(fèi)的時(shí)間和資源,成為目前急需解決的問題之一。
發(fā)明內(nèi)容
鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決或者減緩上述問題的確定PC網(wǎng)頁與移動(dòng)網(wǎng)頁自適應(yīng)關(guān)系的系統(tǒng)和相應(yīng)的確定PC網(wǎng)頁與移動(dòng)網(wǎng)頁自適應(yīng)關(guān)系的方法。
根據(jù)本發(fā)明的一個(gè)方面,提供了一種確定PC網(wǎng)頁與移動(dòng)網(wǎng)頁自適應(yīng)關(guān)系的系統(tǒng),該系統(tǒng)包括:
第一標(biāo)題字段提取器,用于提取移動(dòng)網(wǎng)頁的標(biāo)題字段的至少一部分,作為第一字段;
第二標(biāo)題字段提取器,用于提取PC網(wǎng)頁的標(biāo)題字段的至少一部分,作為第二字段;
字段匹配器,用于根據(jù)所述第一字段和第二字段對(duì)移動(dòng)網(wǎng)頁和PC網(wǎng)頁進(jìn)行匹配;
URL比較器,用于驗(yàn)證匹配成功的移動(dòng)網(wǎng)頁和PC網(wǎng)頁分別對(duì)應(yīng)的URL是否相同;
自適應(yīng)關(guān)系確定器,在所述URL比較器判斷相同的情況下,確定所述PC網(wǎng)頁與所述移動(dòng)網(wǎng)頁存在自適應(yīng)關(guān)系。
優(yōu)選地,所述第一標(biāo)題字段提取器,在網(wǎng)頁的源代碼頭部部分,根據(jù)預(yù)定標(biāo)簽提取移動(dòng)網(wǎng)頁的標(biāo)題字段的至少一部分;所述第二標(biāo)題字段提取器,在網(wǎng)頁的源代碼頭部部分,根據(jù)預(yù)定標(biāo)簽提取PC網(wǎng)頁的標(biāo)題字段的至少一部分。
優(yōu)選地,所述字段匹配器進(jìn)一步包括:
第一數(shù)字簽名生成模塊,用于根據(jù)所述第一字段,生成所述移動(dòng)網(wǎng)頁的數(shù)字簽名,作為第一數(shù)字簽名;
第二數(shù)字簽名生成模塊,用于根據(jù)所述第二字段,生成所述PC網(wǎng)頁的數(shù)字簽名,作為第二數(shù)字簽名;
數(shù)字簽名匹配模塊,用于利用所述第一數(shù)字簽名和第二數(shù)字簽名對(duì)移動(dòng)網(wǎng)頁和PC網(wǎng)頁進(jìn)行匹配。
優(yōu)選地,所述第一數(shù)字簽名生成模塊進(jìn)一步包括:
第一分塊單元,用于對(duì)所述第一字段進(jìn)行分塊處理;
第一頻率統(tǒng)計(jì)單元,用于統(tǒng)計(jì)每個(gè)分塊在所述移動(dòng)網(wǎng)頁所屬網(wǎng)站中出現(xiàn)的頻率;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京奇虎科技有限公司;奇智軟件(北京)有限公司,未經(jīng)北京奇虎科技有限公司;奇智軟件(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410838598.1/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 移動(dòng)臺(tái),基站,移動(dòng)通信系統(tǒng),移動(dòng)通信與移動(dòng)通信程序
- 移動(dòng)通信系統(tǒng)、移動(dòng)終端以及移動(dòng)通信方法
- 移動(dòng)支付裝置、移動(dòng)終端POS以及移動(dòng)終端
- 移動(dòng)控制裝置、移動(dòng)體、移動(dòng)體系統(tǒng)、移動(dòng)控制方法及程序
- 移動(dòng)終端后蓋、移動(dòng)終端殼體及移動(dòng)終端
- 移動(dòng)平臺(tái)的輔助移動(dòng)方法、移動(dòng)裝置及移動(dòng)平臺(tái)
- 自移動(dòng)設(shè)備移動(dòng)方法及自移動(dòng)設(shè)備
- 移動(dòng)輪(支撐移動(dòng))
- 移動(dòng)房屋(移動(dòng)酒店)
- 移動(dòng)控制方法、移動(dòng)裝置及移動(dòng)平臺(tái)





