[發明專利]使超文字標示語言網頁轉換成純文字的方法及其系統有效
| 申請號: | 200710080293.9 | 申請日: | 2007-02-16 |
| 公開(公告)號: | CN101246481A | 公開(公告)日: | 2008-08-20 |
| 發明(設計)人: | 黃子癸;蔡弘揚 | 申請(專利權)人: | 易搜比控股公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京中原華和知識產權代理有限責任公司 | 代理人: | 壽寧;張華輝 |
| 地址: | 英屬開曼群*** | 國省代碼: | 開曼群島;KY |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文字 標示 語言 網頁 轉換 方法 及其 系統 | ||
技術領域
本發明涉及一種網頁轉換成純文字的方法,特別是涉及一種使超文字標示語言網頁轉換成純文字的方法及其系統。
背景技術
隨著網際網路的普及,人們愈來愈習慣通過網際網路來獲得訊息與查詢資料,例如直接登入網站來瀏覽新聞網頁或文章網頁等,目前網頁的格式大都為超文件標示語言(Hypertext?Markup?Language;以下簡稱HTML)。
又,目前網路上出現一種新資訊提供方式,稱為簡單聯合供稿(ReallySimple?Syndication,以下簡稱RSS),讓使用者可以自行訂閱想看資訊內容,而把網頁中最新訊息及新聞同步發送予訂閱者。詳細來說,使用者端安裝RSS瀏覽器后,可以通過RSS瀏覽器訂閱網站所提供的各式各樣RSS頻道。而后,RSS瀏覽器會定期更新已訂閱RSS頻道,即RSS瀏覽器每隔一段時間會主動下載訂閱頻道中新的新聞或文章的簡介(如標題、摘要與連結網址)至使用者端,讓使用者即時了解頻道的更新資訊。若使用者對新的新聞或文章有興趣時,點選簡介即可利用其連結網址連結對應HTML網頁瀏覽完整內容。
然而,無論是以直接登入網站或以RSS瀏覽器瀏覽HTML網頁,HTLM網頁經常同時存在許多無涉于主要內容的資訊,如廣告、其他HTML網頁的介紹、網站資訊等等,影響使用者對網頁中主要內容的閱讀速度,造成使用者難以迅速了解網頁的主要內容。
由此可見,上述現有的網路資訊提供方式在方法、結構及使用上,顯然仍存在有不便與缺陷,而亟待加以進一步改進。為解決上述存在問題,相關廠商莫不費盡心思來謀求解決之道,但長久以來一直未見適用的設計被發展完成,而一般方法及產品又沒有適切的方法及結構能解決上述問題,此顯然是相關業者急欲解決的問題。因此如何能創設一種新的使超文字標示語言網頁轉換成純文字的方法及其系統,實屬當前重要研發課題之一,亦成為當前業界極需改進的目標。
有鑒于上述現有的網路資訊提供方式存在的缺陷,本發明人基于從事此類產品設計制造多年豐富的實務經驗及專業知識,并配合學理的運用,積極加以研究創新,以期創設一種新的使超文字標示語言網頁轉換成純文字的方法及其系統,能夠改進一般現有的網路資訊提供方式,使其更具有實用性。經過不斷的研究、設計,并經反復試作及改進后,終于創設出確具實用價值的本發明。
發明內容
本發明的目的在于,克服現有的網路資訊提供方式存在的缺陷,而提供一種便于閱讀的使超文字標示語言網頁轉換成純文字的方法及其系統,非常適于實用。
本發明的另一目的在于,提供一種可以達到純文字轉換精確度較高的使超文字標示語言網頁轉換成純文字的方法及其系統,從而更加適于實用。
本發明的目的及解決其技術問題是采用以下技術方案來實現的。依據本發明提出的一種使超文字標示語言網頁轉換成純文字的方法,其是先接收一超文字標示語言網頁的超文字標示語言原始碼,并執行一前置標簽程序以擷取出一超文字標示語言原始碼中的一部分,該超文字標示語言原始碼中的一部分內具有多數個字串及多數個位于前述字串間的標簽,再依據該超文字標示語言原始碼中的一部分進行以下步驟:(A)、計算該超文字標示語言原始碼中的一部分內各字串的長度與位置,找出前述多數個字串中長度為前第一預設值百分比的字串,前述前第一預設值百分比的字串的數量,等于超文字標示語言原始碼中的一部分內所有字串數量與該第一預設值百分比的乘積;(B)、分析前述前第一預設值百分比的字串中各字串與其余字串間的一位置間隔,并對于與該前第一預設值百分比的各字串位置間隔不大于一第二預設值的字串,標示為一同一個區塊,以找出一最大區塊;以及(C)、刪除前述最大區塊內前述字串間的標簽以取得一主要內容。本發明的目的及解決其技術問題還可采用以下技術措施進一步實現。
前述的使超文字標示語言網頁轉換成純文字的方法,其中所述的第一預設值為3~15中的一整數,前述第二預設值為2~10中的一整數。
前述的使超文字標示語言網頁轉換成純文字的方法,其中所述的步驟(C)中被刪除標簽是一段落格式標簽,前述段落格式標簽為<br>或一<p>和</p>。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于易搜比控股公司,未經易搜比控股公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710080293.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:簡單聯合供稿的頻道更新方法及其系統
- 下一篇:車輛的行車記錄裝置





