[發明專利]一種站點資源管理方法及裝置無效
| 申請號: | 201210592976.3 | 申請日: | 2012-12-31 |
| 公開(公告)號: | CN103218390A | 公開(公告)日: | 2013-07-24 |
| 發明(設計)人: | 崔建偉;王佳;李偉剛 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 站點 資源管理 方法 裝置 | ||
1.一種站點資源管理方法,其特征在于,包括以下步驟:
對web站點進行數據挖掘以獲取所述web站點中各個頁面的URL數據;
對所述各個頁面的URL數據進行語義分析以獲取各個頁面的TAG特征和Mypos特征,其中所述TAG特征和所述Mypos特征屬于訓練得到的多個TAG特征和多個Mypos特征;以及
根據各個頁面的TAG特征和Mypos特征得到所述各個頁面在預定分類表的各個分類下的權重。
2.根據權利要求1所述的方法,其特征在于,進一步包括步驟:
根據所述各個頁面在預定分類表的各個分類下的權重將所述各個頁面輸出給對應的聚合頻道。
3.根據權利要求1所述的方法,其特征在于,進一步包括步驟:
根據所述各個頁面在預定分類表的各個分類下的權重計算所述各個頁面的相似度以進行相似頁面推薦。
4.根據權利要求1至3中任一項所述的方法,其特征在于,所述預定分類表的各個分類包括籃球、足球、網球、其他體育、財經、女性、娛樂、軍事、國際時事、社會、美食、汽車、旅游、科技、健康、兩性、笑話、動漫或游戲。
5.根據權利要求1至3中任一項所述的方法,其特征在于,對web站點進行數據挖掘以獲取所述web站點中各個頁面的URL數據的步驟包括:
對所述web站點進行日志挖掘和站點挖掘,其中通過所述日志挖掘獲取頁面的URL數據以及所述頁面的訪問熱度,通過所述站點挖掘獲取所述站點下各個頁面的URL數據以及站點結構數據。
6.根據權利要求5所述的方法,其特征在于,所述訪問熱度用于確定頁面的點擊量,所述站點結構數據用于實現web站點至web?app的結構轉換。
7.根據權利要求1至3中任一項所述的方法,其特征在于,對所述各個頁面的URL數據進行語義分析以獲取各個頁面的TAG特征和Mypos特征的步驟包括:
對所述各個頁面的URL數據進行切詞分析以得到多個詞;
將所述多個詞與訓練得到的多個TAG特征和多個Mypos特征進行匹配以獲取各個頁面的TAG特征和Mypos特征。
8.一種站點資源管理裝置,其特征在于,包括:
挖掘模塊,用于對web站點進行數據挖掘以獲取所述web站點中各個頁面的URL數據;
特征獲取模塊,用于對所述各個頁面的URL數據進行語義分析以獲取各個頁面的TAG特征和Mypos特征,其中所述TAG特征和所述Mypos特征屬于訓練得到的多個TAG特征和多個Mypos特征;以及
權重計算模塊,用于根據各個頁面的TAG特征和Mypos特征得到所述各個頁面在預定分類表的各個分類下的權重。
9.根據權利要求8所述的裝置,其特征在于,還進一步包括:
頁面分類模塊,用于根據所述各個頁面在預定分類表的各個分類下的權重將所述各個頁面輸出給對應的聚合頻道。
10.根據權利要求8所述的裝置,其特征在于,還進一步包括:
相似度計算模塊,用于根據所述各個頁面在預定分類表的各個分類下的權重計算所述各個頁面的相似度以進行相似頁面推薦。
11.根據權利要求8至10中任一項所述的裝置,其特征在于,所述預定分類表的各個分類包括籃球、足球、網球、其他體育、財經、女性、娛樂、軍事、國際時事、社會、美食、汽車、旅游、科技、健康、兩性、笑話、動漫或游戲。
12.根據權利要求8至10中任一項所述的裝置,其特征在于,所述挖掘模塊包括:
日志挖掘單元,用于獲取頁面的URL數據以及所述頁面的訪問熱度;
站點挖掘單元,用于獲取所述站點下各個頁面的URL數據以及站點結構數據。
13.根據權利要求12所述的裝置,其特征在于,所述訪問熱度用于確定頁面的點擊量,所述站點結構數據用于實現web站點至web?app的結構轉換。
14.根據權利要求8至10中任一項所述的裝置,其特征在于,所述特征獲取模塊包括:
切詞分析單元,用于對所述各個頁面的URL數據進行切詞分析以得到多個詞;
匹配單元,用于將所述多個詞與訓練得到的多個TAG特征和多個Mypos特征進行匹配以獲取各個頁面的TAG特征和Mypos特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210592976.3/1.html,轉載請聲明來源鉆瓜專利網。





