[發明專利]一種確定頁面可讀性的方法和服務器無效
| 申請號: | 201210104882.7 | 申請日: | 2012-04-11 |
| 公開(公告)號: | CN103365935A | 公開(公告)日: | 2013-10-23 |
| 發明(設計)人: | 朱靖君;林世飛 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/22 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 黃厚剛 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 確定 頁面 可讀性 方法 服務器 | ||
技術領域
本發明涉及計算機技術領域,特別涉及一種確定頁面可讀性的方法和服務器。
背景技術
隨著無線互聯網技術和移動終端的發展,越來越多的人開始使用移動終端瀏覽網頁。移動終端瀏覽器展示的是wap(Wireless?Application?Protocol,為無線應用協議)頁面,它不同于在電腦瀏覽器中看到的web頁面,一般的wap頁面較小且較簡單。Wap頁面在制作時有些是直接從web頁面修改而來的,在修改的時候很容易忽視了wap頁面的特性,造成修改的頁面不符合wap頁面的規范,影響wap頁面的可讀性。因此需要一套評估wap頁面可讀性的方法,以便搜索引擎根據該評估對各wap頁面進行排序,使得用戶優先看到可讀性好的頁面。
現有技術中對評估wap頁面的可讀性,一般是通過幾方面進行的:一、對頁面中的背景顏色和文字顏色進行對比,評估該頁面的可讀性,減少閱讀疲勞;二、對頁面中文字的密度,文字的大小以及文字的字體進行判斷,評估該頁面的可讀性。
在實現本發明的過程中,發明人發現現有技術至少存在以下問題:
現有技術對wap頁面可讀性的評估會受評估者主觀設定的評估因素影響,僅代表部分用戶的體驗,并不能客觀的評估出wap頁面可讀性。因此根據該方法得到的確定頁面可讀性的結論,并不能全面綜合的評估wap頁面的可讀性,由此得到的搜索引擎wap頁面的排序對提升用戶的體驗效果差。
發明內容
為了提高評估wap頁面可讀性的客觀性,且根據該評估結論用于搜索引擎對wap頁面的排序,可以提高用戶的體驗。本發明實施例提供了一種確定頁面可讀性的方法和服務器。所述技術方案如下:
本發明實施例提出了一種確定頁面可讀性的方法,包括:
獲取無線應用協議wap頁面的頁面信息;
在所述wap頁面中獲取影響所述wap頁面可讀性的特征項信息;
根據所述wap頁面的頁面信息和所述特征項信息,確定所述wap頁面的可讀性。
作為上述技術方案的優選,所述獲取無線應用協議wap頁面的頁面信息,具體包括:
獲取所述wap頁面中的文本內容和所述文本內容的總字節數;
提取所述wap頁面中的換行標識,根據所述換行標識確定所述wap頁面的總段落數以及每段落的字節數;
將所述wap頁面中的文本內容、所述文本內容的總字節數、所述wap頁面的總段落數以及每段落的字節數作為所述wap頁面的頁面信息。
作為上述技術方案的優選,所述在所述wap頁面中獲取影響所述wap頁面可讀性的特征項信息,具體包括:
根據所述wap頁面中的文本內容,獲取所述wap頁面中的所述終極電子布告欄UBB代碼;
根據所述wap頁面中的文本內容,獲取所述wap頁面中的所述客戶端腳本語言JavaScript代碼和層疊樣式表Css代碼;
根據所述wap頁面中的每段落的字節數,獲取所述wap頁面中的所述字節數超過預設閾值的段落;
根據所述wap頁面中的文本內容,獲取所述wap頁面中的所述不可用統一資源定位符URL鏈接;
根據所述wap頁面中的文本內容,獲取所述wap頁面中的所述亂碼字符;
將所述UBB代碼、所述JavaScript代碼和Css代碼、所述字節數超過預設閾值的段落、所述不可用URL鏈接、所述亂碼字符作為特征項信息。
作為上述技術方案的優選,所述根據所述wap頁面的頁面信息和所述特征項信息,確定所述wap頁面的可讀性,具體包括:
根據所述wap頁面的文本內容的總字節數和所述UBB代碼的字節數,確定所述UBB代碼的可讀性;
根據所述wap頁面的文本內容的總字節數和所述JavaScript和Css代碼的字節數,確定所述JavaScript和Css代碼的可讀性;
根據所述wap頁面的總段落數和所述字節數超過預設閾值的段落的數量,確定所述字節數超過預設閾值的段落的可讀性;
根據所述wap頁面的文本內容的總字節數和所述不可用URL鏈接的字節數,確定所述不可用URL鏈接的可讀性;
根據所述wap頁面的文本內容的總字節數和所述亂碼字符的字節數,確定所述亂碼字符的可讀性;
根據確定得到的至少一種特征項信息的可讀性,確定所述wap頁面的可讀性。
本發明實施例提出了一種確定頁面可讀性的服務器,包括:
第一獲取模塊,用于獲取無線應用協議wap頁面的頁面信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210104882.7/2.html,轉載請聲明來源鉆瓜專利網。





