[發明專利]網站內容信息提供方法、系統及裝置在審
申請號: | 201110362646.0 | 申請日: | 2011-11-16 |
公開(公告)號: | CN103116580A | 公開(公告)日: | 2013-05-22 |
發明(設計)人: | 王寓辰;倪偉;畢婭娜 | 申請(專利權)人: | 中國移動通信集團公司 |
主分類號: | G06F17/30 | 分類號: | G06F17/30 |
代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 郭潤湘 |
地址: | 100032 *** | 國省代碼: | 北京;11 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 網站 內容 信息 提供 方法 系統 裝置 | ||
1.一種網站內容信息提供方法,其特征在于,包括:
根據獲得的引入網站的初始鏈接信息進行爬行搜索,獲取到所述引入網站包括的鏈接信息,并獲取所述鏈接信息的鏈接對象及其屬性信息;
根據獲取的所述鏈接信息的鏈接對象及其屬性信息,建立所述鏈接信息對應的鏈接對象索引;
根據各所述鏈接信息的鏈接對象索引之間的關聯關系,建立各引入網站的網站資源視圖;所述網站資源視圖中包括按設定規則排列的各引入網站的鏈接信息對應的鏈接對象索引;
根據建立的網站資源視圖向網站信息請求方提供網站內容信息。
2.如權利要求1所述的方法,其特征在于,所述根據獲得的引入網站的初始鏈接信息進行爬行搜索,具體包括:
根據獲得的引入網站的初始鏈接信息和預先配置的搜索策略進行爬行搜索,其中搜索策略包括下列策略之一或組合:深度優先策略、廣度優先策略和聚焦搜索策略。
3.如權利要求1所述的方法,其特征在于,所述根據獲取的所述鏈接信息的鏈接對象及其屬性信息,建立所述鏈接信息對應的鏈接對象索引,具體包括:
根據獲取的所述鏈接信息對應的鏈接對象及其屬性信息構建各鏈接對象的內容索引,以及根據所述鏈接信息的路徑信息確定所述鏈接信息之間的關聯關系;建立起包括各鏈接信息關聯關系以及各鏈接信息對應的鏈接對象的內容索引的鏈接對象索引。
4.如權利要求1所述的方法,其特征在于,所述根據建立的網站資源視圖向網站信息請求方提供網站內容信息,具體包括:
根據網站信息請求設備發送的視圖資源獲取請求,將建立的網站資源視圖提供給網站信息請求設備或根據視圖資源獲取請求中的配置要求對建立的網站資源視圖進行配置調整后提供給網站信息請求設備,由網站信息請求設備根據提供的網站資源視圖向網站信息請求方提供所請求的網站內容信息;或
根據網站信息請求設備發送的視圖資源查詢請求,向網站信息請求設備開放查詢接口,通過查詢接口向網站信息請求設備提供建立的網站資源視圖或提供根據視圖資源查詢請求中的配置要求對建立的網站資源視圖進行配置調整后的網站資源視圖;由網站信息請求設備根據查詢到的網站資源視圖向網站信息請求方提供所請求的網站內容信息站點管理服務。
5.一種網站內容信息提供裝置,其特征在于,包括:
搜索模塊,用于根據獲得的引入網站的初始鏈接信息進行爬行搜索,獲取到所述引入網站包括的鏈接信息,并獲取所述鏈接信息的鏈接對象及其屬性信息;
索引模塊,用于根據獲取的鏈接對象及其屬性信息,建立所述鏈接信息對應的鏈接對象索引;
視圖資源生成模塊,用于根據各所述鏈接信息的鏈接對象索引之間的關聯關系,建立各引入網站的網站資源視圖;所述網站資源視圖中包括按設定規則排列的各引入網站的鏈接信息對應的鏈接對象索引;
接入檢索模塊,用于根據建立的網站資源視圖向網站信息請求方提供網站內容信息。
6.如權利要求5所述的裝置,其特征在于,還包括:搜索策略管理模塊;
所述搜索策略管理模塊,用于配置搜索策略,所述搜索策略包括但不限于下列策略之一或組合:深度優先策略、廣度優先策略和聚焦搜索策略
所述搜索模塊,具體用于根據獲得的引入網站的初始鏈接信息和預先配置的搜索策略進行爬行搜索。
7.如權利要求5所述的裝置,其特征在于,所述索引模塊,具體用于:
根據獲取的所述鏈接信息包括的鏈接對象及其屬性信息構建各鏈接對象的內容索引,以及根據所述鏈接信息的路徑信息確定所述鏈接信息之間的關聯關系;建立起包括各鏈接信息關聯關系以及各鏈接信息對應的鏈接對象的內容索引的鏈接對象索引。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國移動通信集團公司,未經中國移動通信集團公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110362646.0/1.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置