[發明專利]透過分析網頁結構抓取網站信息的方法無效
| 申請號: | 200880017826.1 | 申請日: | 2008-05-29 |
| 公開(公告)號: | CN101689176A | 公開(公告)日: | 2010-03-31 |
| 發明(設計)人: | 崔文圣;韓萬鎮;金泰均 | 申請(專利權)人: | 怡斯福樂株式會社 |
| 主分類號: | G06F17/00 | 分類號: | G06F17/00 |
| 代理公司: | 北京華夏博通專利事務所 | 代理人: | 劉 俊 |
| 地址: | 韓國首*** | 國省代碼: | 韓國;KR |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 透過 分析 網頁 結構 抓取 網站 信息 方法 | ||
技術領域
本發明涉及一種網頁結構分析方法,更具體地,本發明涉及一種透過網頁結構分析以確定網站信息的方法,該方法如同一個軌跡程序可以分析網頁結構,該軌跡程序預先安裝于客戶端及服務器,當每次網頁作動或存取時產生一特別訊息。該方法可以藉由使用客戶端-服務器系統的使用者確定存取至特定網頁以及網絡漫游路徑,然后制作一使用此結果的數據庫,從而確定例如對于網站的存取狀態、使用者感興趣的領域等信息,并改善客戶關系管理(Customer?RelatIonshIp?Management,CRM),并標簽客戶管理。
背景技術
最近幾年,記錄分析(loganalysIs)已被廣泛的使用于偵查信息,例如:一使用者對于一特殊網頁的存取狀態。記錄分析基于如訪客人數、瀏覽網頁次數、網絡cookIe值(cookIeValue)等的信息分析來提供信息以確定一網絡狀態。
記錄分析被分類為:(1)一種記錄文件插入方法,直接將一記錄文件插入管理特殊網頁的網絡服務器中,再產生如在記錄文件中的存取信號,再基于該信號產生數據并分析該數據,(2)一種碼插入方法,將描述法及/或碼插入一網站中,再基于該碼的數量產生數據,并分析該數據,以及(3)一間接記錄分析方法,分析外部的統計資料。
該記錄文件插入方法的缺點在于當使用者(存取該服務器者)數量增加,該紀錄文件數據量變的很大,則此作業必須委托一特殊的分析組織。該碼插入方法適合用于被由較少數量的訪客所存取的網站,但缺點在于如果存取此網站的訪客數目超過預定數目的時候,比起該記錄文件插入方法,此方法的工作量會變的很大。
因為該記錄分析是由必須將該等碼及/或記錄文件插入一網站這樣的方式所執行,故其可由一網站管理者使用來只檢查他/她管理的網站的使用狀態。換言之,該傳統的記錄分析只可執行一受限的管理中心分析。
當一管理者需要策略上地確定競爭同業的網站與他/她所擁有的網站的使用狀態,以偵測哪些網站受歡迎、在該些網站中和網頁中的哪些使用者有較高的興趣、哪些網站由廣告商所贊助,并經由使用者的網絡漫游周期來分析客戶關系管理(CRM)時,除了該管理者所擁有的網站、該管理者必須確定網站的存取狀態。然而,該提供管理中心分析的傳統記錄分析無法獲得有關其它網站使用狀態的信息或有關顧客喜好的網站的信息等。
當網絡營銷被迅速的開發時,比起競爭同業,該傳統的記錄分析能使一網站管理者只能夠確定他/她管理的網站的存取狀態,而無法允許該管理者建立進階的營銷策略。再者,該傳統的記錄分析未提出可以迅速處理使用者需求的方法。因此,分析網站需要一個新的方法。
因應此需求,例如,已建議一種確定在使用者項目中的網絡漫游狀態與網絡漫游路徑而非確定管理網站的管理者的方法。換言之,該方法基于一使用者特殊族群可以擷取有關網絡存取的信息。
為了確定一特殊使用者是否存取一特殊網站以及為了確定該使用者網絡漫游路徑,前導過程需被執行:需分析由使用者存取的該網站的特殊網頁結構,以及需產生與該被分析的網頁結構匹配的存取信號并處理所有信號。
通常,一網頁被設計為使用框架集標簽(framesettags)和/或I框架標簽(I?frametags)的一單一頁面或一復合式頁面。
一單一頁面為僅使用一個網站位置(UnIform?Resource?Locator,URL)來連接一單一網絡服務器的網頁型態。也就是說,一單一頁面具有最普通的結構并為不需使用卷標的超文件標記語言(html)頁面,例如框架集(frameset)或I框架(I?frame)。一復合式頁面為使用不同URL來連接一個網絡服務器或復數個網絡服務器的網頁型態。一復合式頁面為一使用標簽的網頁,例如frameset或I?frame。該主頁面辨別頁面導覽并引用在網址列(addressbar)中對應URL的頁面。該次頁面由在該主頁面中的frameset或I?frame產生。
因特網的網站皆是由一單一網頁和/或一復合式網頁所組成。該網頁被連接至各個網站,因此使用者可以在這些網站間作動。使用者在網頁下載期間可以從一個網頁作動至另一個網頁。使用者亦可在當一網頁在被完全下載前就被終止時,從一個網頁作動至另一個網頁。
為了分析一網頁結構,該傳統方法需優先解決下列問題:
(1)由于藉由一單一網頁和/或一復合式網頁來設計網頁且該等網頁根據使用者的網絡漫游被重復作動,故須根據該網頁型態來精確的分析網頁結構。
(2)由于該復合式頁面包含復數個次頁面且只有在所有次頁面都被載入時整個頁面才可被完全載入,故需辨別復合式頁面中的次頁面。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于怡斯福樂株式會社,未經怡斯福樂株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200880017826.1/2.html,轉載請聲明來源鉆瓜專利網。





