[發明專利]一種網頁中確定鏈接文字權重的方法和設備無效
| 申請號: | 201010180876.0 | 申請日: | 2010-05-24 |
| 公開(公告)號: | CN102262629A | 公開(公告)日: | 2011-11-30 |
| 發明(設計)人: | 王頊 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京鑫媛睿博知識產權代理有限公司 11297 | 代理人: | 龔家驊 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網頁 確定 鏈接 文字 權重 方法 設備 | ||
技術領域
本發明涉及互聯網領域,特別是涉及一種網頁中確定鏈接文字權重的方法和設備。
背景技術
隨著Internet的迅速發展,網絡作為一種廣義的、寬泛的、公開的、對大多數人有效的傳媒,互聯網通過大量的,每天至少有幾千人乃至幾十萬人訪問的網站,實現了真正的大眾傳媒的作用。互聯網可以比任何一種方式都更快、更經濟、更直觀、更有效地把一個思想或信息傳播開來。
根據權威機構的統計,50%的用戶閱讀在線的雜志,48%的用戶閱讀在線報紙。印刷出版物書籍,即使是報紙,從編輯、排版、印刷到發行都需要時間,而網頁則非常簡單,只要放在網上就可以了。印刷出版物是要送到讀者手里的,而網頁則由讀者自己來取,讀者可以常看常新,隨時追蹤事件的發展。并且,由于網頁使用的鏈接文字可以通過鏈接的方式指向互聯網上所有與該網頁相關的內容,不管是進行理論研究,還是讀新聞,都可以很方便地找到相關的資料。
所謂鏈接文字是對目標頁面的一種有效表述,是一個網頁用來指明鏈向其他網頁的文字,通過點擊這段文字,可以訪問到這段文字后的目標網頁(指向網頁),在搜索引擎中具有重要的作用,同時,為了表明這個鏈接文字的重要程度,會對該鏈接文字給與一個權重值,用于表明其重要程度。
通過記錄用戶在網頁上的點擊行為并結合已有的網頁鏈接文字信息,獲取到用戶的點擊行為和有效鏈接文字。
為方便描述,如圖1所示,網頁A中的三個連接文字AB,AC,AD,鏈接文字AB是從網頁A指向網頁B,鏈接文字AC是從網頁A指向網頁C,鏈接文字AD是從網頁A指向網頁D,鏈接文字AB,AC,AD都是從網頁A中指向其他頁面的,現有的鏈接文字權重的計算方法,通過網頁A的鏈接文字權重RA/M(RA表示網頁A的權重,M為網頁A的出鏈個數)得到鏈接文字的權重,所以三者的權重是一樣的。
但在實際的使用中,鏈接文字AB,AC,AD對于用戶來說,有效程度是不一樣的,例如:對于網頁A有N(N為網頁A總用戶點擊數)個點擊鏈接文字的行為,其中有NB個點擊鏈接文字AB,NC個點擊鏈接文字AC,ND個點擊AD(N=NB+NC+ND)。因此,對于網頁A出鏈的三個鏈接文字而言,由于點擊次數的不同,其權重也應該是不相同的。由于鏈接文字的權重對于搜索引擎是很重要的計算因子,因此,權重是否準確直接決定了搜索引擎的效果。
而基于上述情況,上述現有技術中提供的鏈接文字權重的獲取方法無法準確得到鏈接文字的權重。
發明內容
本發明提供了一種網頁中確定鏈接文字權重的方法和設備,以解決鏈接文字與實際情況不符的問題,實現有效地獲取網頁中重要的連接文字,該方法包括:
獲取一個網頁的數據信息和所述網頁的訪問信息;
根據所述網頁的數據信息和所述網頁的訪問信息結合預設策略確定在所述網頁中的各個鏈接文字的權重。
其中,所述網頁的數據信息,包括:
所述網頁的權重和網頁中的各個鏈接文字,以及所述網頁的指向網頁。
其中,所述獲取網頁的訪問信息,包括:
通過用戶監控系統獲取所述網頁的總訪問量和所述網頁中各個鏈接文字的點擊次數。
其中,所述預設策略,具體包括:
當所述網頁訪問信息是用戶監控系統監控到的訪問和點擊情況時,根據所述網頁中不同鏈接文字點擊數的不同確定所述網頁中不同的鏈接文字的權重。
其中,所述根據所述網頁中不同鏈接文字點擊數的不同確定所述網頁中不同的鏈接文字的權重,具體包括:
所述網頁的權重乘以所述網頁中鏈接文字的點擊次數與所述網頁總訪問量的比值。
一種網頁中確定鏈接文字權重的設備,所述設備包括:
獲取單元,獲取一個網頁的數據信息和所述網頁的訪問信息;
數據確定單元,與所述獲取單元連接,根據所述網頁的數據信息和所述網頁的訪問信息結合預設策略確定在所述網頁中的各個鏈接文字的權重。
其中,所述獲取單元用于,獲取所述網頁的權重和網頁中的鏈接文字,以及所述網頁的指向網頁。
其中,所述獲取單元還用于,通過用戶監控系統獲取所述網頁的總訪問量和所述網頁中各個鏈接文字的點擊次數。
其中,所述數據確定單元包括:
判斷子單元,用于判斷網頁訪問信息是否為用戶監控系統監控到的訪問和點擊情況;
確定子單元,與所述判斷子單元相連,用于當所述網頁訪問信息是用戶監控系統監控到的訪問和點擊情況時,根據所述網頁中不同鏈接文字點擊數的不同確定所述網頁中不同的鏈接文字的權重。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010180876.0/2.html,轉載請聲明來源鉆瓜專利網。





