[發(fā)明專利]一種站點(diǎn)資源管理方法及裝置無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 201210592976.3 | 申請(qǐng)日: | 2012-12-31 |
| 公開(公告)號(hào): | CN103218390A | 公開(公告)日: | 2013-07-24 |
| 發(fā)明(設(shè)計(jì))人: | 崔建偉;王佳;李偉剛 | 申請(qǐng)(專利權(quán))人: | 百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京清亦華知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 站點(diǎn) 資源管理 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及互聯(lián)網(wǎng)應(yīng)用技術(shù)領(lǐng)域,特別涉及一種站點(diǎn)資源管理方法及裝置。?
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù),尤其是智能搜索、智能廣告推薦等技術(shù)的發(fā)展,對(duì)于網(wǎng)站進(jìn)行分析、歸類的需求越來(lái)越被重視。如此一來(lái),就需要一種將站點(diǎn)的網(wǎng)頁(yè)資源自動(dòng)進(jìn)行分類及組織的管理方法。現(xiàn)有技術(shù)中,經(jīng)常簡(jiǎn)單的通過網(wǎng)頁(yè)文本標(biāo)題對(duì)網(wǎng)頁(yè)進(jìn)行劃分,但這一方法的準(zhǔn)確性不高。?
發(fā)明內(nèi)容
本發(fā)明旨在至少在一定程度上解決上述技術(shù)問題之一或至少提供一種有用的商業(yè)選擇。?
為此,本發(fā)明的第一個(gè)目的在于提出一種站點(diǎn)資源管理方法,根據(jù)網(wǎng)頁(yè)內(nèi)容等因素針對(duì)網(wǎng)頁(yè)的網(wǎng)頁(yè)類型進(jìn)行智能分析,為對(duì)站點(diǎn)網(wǎng)頁(yè)資源進(jìn)行管理、分類提供了判斷依據(jù)。本發(fā)明的第二個(gè)目的在于提出一種站點(diǎn)資源管理裝置。?
為達(dá)到上述目的,本發(fā)明第一方面的實(shí)施例提出了一種站點(diǎn)資源管理方法,包括以下步驟:對(duì)web站點(diǎn)進(jìn)行數(shù)據(jù)挖掘以獲取所述web站點(diǎn)中各個(gè)頁(yè)面的URL數(shù)據(jù);對(duì)所述各個(gè)頁(yè)面的URL數(shù)據(jù)進(jìn)行語(yǔ)義分析以獲取各個(gè)頁(yè)面的TAG特征和Mypos特征,其中所述TAG特征和所述Mypos特征屬于訓(xùn)練得?到的多個(gè)TAG特征和多個(gè)Mypos特征;根據(jù)各個(gè)頁(yè)面的TAG特征和Mypos特征得到所述各個(gè)頁(yè)面在預(yù)定分類表的各個(gè)分類下的權(quán)重。?
根據(jù)本發(fā)明實(shí)施例的站點(diǎn)資源管理方法,可以通過對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行分詞、提取特征的方式針對(duì)網(wǎng)頁(yè)的網(wǎng)頁(yè)類型進(jìn)行智能分析,為對(duì)站點(diǎn)網(wǎng)頁(yè)資源進(jìn)行管理、分類提供了判斷依據(jù),使得為用戶提供的網(wǎng)頁(yè)推薦可以更加符合用戶的需要,提高了用戶體驗(yàn)。?
在本發(fā)明的一個(gè)實(shí)施例中,所述站點(diǎn)資源管理方法進(jìn)一步包括步驟:根據(jù)所述各個(gè)頁(yè)面在預(yù)定分類表的各個(gè)分類下的權(quán)重將所述各個(gè)頁(yè)面輸出給對(duì)應(yīng)的聚合頻道。?
在本發(fā)明的一個(gè)實(shí)施例中,根據(jù)所述各個(gè)頁(yè)面在預(yù)定分類表的各個(gè)分類下的權(quán)重計(jì)算所述各個(gè)頁(yè)面的相似度以進(jìn)行相似頁(yè)面推薦。?
在本發(fā)明的一個(gè)實(shí)施例中,所述預(yù)定分類表的各個(gè)分類包括籃球、足球、網(wǎng)球、其他體育、財(cái)經(jīng)、女性、娛樂、軍事、國(guó)際時(shí)事、社會(huì)、美食、汽車、旅游、科技、健康、兩性、笑話、動(dòng)漫或游戲。?
在本發(fā)明的一個(gè)實(shí)施例中,對(duì)web站點(diǎn)進(jìn)行數(shù)據(jù)挖掘以獲取所述web站點(diǎn)中各個(gè)頁(yè)面的URL數(shù)據(jù)的步驟包括:對(duì)所述web站點(diǎn)進(jìn)行日志挖掘和站點(diǎn)挖掘,其中通過所述日志挖掘獲取頁(yè)面的URL數(shù)據(jù)以及所述頁(yè)面的訪問熱度,通過所述站點(diǎn)挖掘獲取所述站點(diǎn)下各個(gè)頁(yè)面的URL數(shù)據(jù)以及站點(diǎn)結(jié)構(gòu)數(shù)據(jù)。?
在本發(fā)明的一個(gè)實(shí)施例中,所述訪問熱度用于確定頁(yè)面的點(diǎn)擊量,所述站點(diǎn)結(jié)構(gòu)數(shù)據(jù)用于實(shí)現(xiàn)web站點(diǎn)至web?app的結(jié)構(gòu)轉(zhuǎn)換。?
在本發(fā)明的一個(gè)實(shí)施例中,對(duì)所述各個(gè)頁(yè)面的URL數(shù)據(jù)進(jìn)行語(yǔ)義分析以獲取各個(gè)頁(yè)面的TAG特征和Mypos特征的步驟包括:對(duì)所述各個(gè)頁(yè)面的URL數(shù)據(jù)進(jìn)行切詞分析以得到多個(gè)詞;將所述多個(gè)詞與訓(xùn)練得到的多個(gè)TAG特征?和多個(gè)Mypos特征進(jìn)行匹配以獲取各個(gè)頁(yè)面的TAG特征和Mypos特征。?
本發(fā)明第二方面的實(shí)施例提出了一種站點(diǎn)資源管理裝置,包括:挖掘模塊,用于對(duì)web站點(diǎn)進(jìn)行數(shù)據(jù)挖掘以獲取所述web站點(diǎn)中各個(gè)頁(yè)面的URL數(shù)據(jù);特征獲取模塊,用于對(duì)所述各個(gè)頁(yè)面的URL數(shù)據(jù)進(jìn)行語(yǔ)義分析以獲取各個(gè)頁(yè)面的TAG特征和Mypos特征,其中所述TAG特征和所述Mypos特征屬于訓(xùn)練得到的多個(gè)TAG特征和多個(gè)Mypos特征;權(quán)重計(jì)算模塊,用于根據(jù)各個(gè)頁(yè)面的TAG特征和Mypos特征得到所述各個(gè)頁(yè)面在預(yù)定分類表的各個(gè)分類下的權(quán)重。?
根據(jù)本發(fā)明實(shí)施例的站點(diǎn)資源管理裝置,可以通過對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行分詞、提取特征的方式針對(duì)網(wǎng)頁(yè)的網(wǎng)頁(yè)類型進(jìn)行智能分析,為對(duì)站點(diǎn)網(wǎng)頁(yè)資源進(jìn)行管理、分類提供了判斷依據(jù),使得為用戶提供的網(wǎng)頁(yè)推薦可以更加符合用戶的需要,提高了用戶體驗(yàn)。?
在本發(fā)明的一個(gè)實(shí)施例中,所述站點(diǎn)資源管理裝置進(jìn)一步包括:頁(yè)面分類模塊,用于根據(jù)所述各個(gè)頁(yè)面在預(yù)定分類表的各個(gè)分類下的權(quán)重將所述各個(gè)頁(yè)面輸出給對(duì)應(yīng)的聚合頻道。?
在本發(fā)明的一個(gè)實(shí)施例中,所述站點(diǎn)資源管理裝置進(jìn)一步包括:相似度計(jì)算模塊,用于根據(jù)所述各個(gè)頁(yè)面在預(yù)定分類表的各個(gè)分類下的權(quán)重計(jì)算所述各個(gè)頁(yè)面的相似度以進(jìn)行相似頁(yè)面推薦。?
在本發(fā)明的一個(gè)實(shí)施例中,所述預(yù)定分類表的各個(gè)分類包括籃球、足球、網(wǎng)球、其他體育、財(cái)經(jīng)、女性、娛樂、軍事、國(guó)際時(shí)事、社會(huì)、美食、汽車、旅游、科技、健康、兩性、笑話、動(dòng)漫或游戲。?
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司,未經(jīng)百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210592976.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種移動(dòng)通信站點(diǎn)規(guī)劃方法及系統(tǒng)
- 空鐵運(yùn)輸系統(tǒng)
- 多運(yùn)營(yíng)商站點(diǎn)規(guī)劃方法及裝置
- 一種隨機(jī)接入方法及站點(diǎn)
- 一種公交過需站點(diǎn)的真實(shí)OD的分析方法
- 用于生成物聯(lián)網(wǎng)系統(tǒng)中的站點(diǎn)的配置文件的方法及裝置
- 基于大數(shù)據(jù)分析的配送站點(diǎn)建設(shè)系統(tǒng)及方法
- 一種公交中途站點(diǎn)名稱生成方法及裝置
- 一種公交站點(diǎn)名稱生成方法及裝置
- 一種基于大數(shù)據(jù)分析的配送站點(diǎn)建設(shè)方法
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





