[發(fā)明專利]一種視頻內(nèi)容及內(nèi)容源爬取方法在審
| 申請?zhí)枺?/td> | 201310022725.6 | 申請日: | 2013-01-21 |
| 公開(公告)號: | CN103945278A | 公開(公告)日: | 2014-07-23 |
| 發(fā)明(設(shè)計(jì))人: | 徐開誠;脫立恒;劉學(xué);靳巾;江佳偉 | 申請(專利權(quán))人: | 中國科學(xué)院聲學(xué)研究所;上海尚恩華科網(wǎng)絡(luò)科技股份有限公司 |
| 主分類號: | H04N21/63 | 分類號: | H04N21/63;H04N21/432;G06F17/30 |
| 代理公司: | 北京法思騰知識產(chǎn)權(quán)代理有限公司 11318 | 代理人: | 楊小蓉;楊青 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 視頻 內(nèi)容 源爬取 方法 | ||
1.一種視頻內(nèi)容爬取方法,所述方法包含:
步驟101)為每類視頻內(nèi)容設(shè)定初始爬取周期,按設(shè)定的爬取周期從內(nèi)容源爬取內(nèi)容并緩存;
步驟102)根據(jù)每類視頻內(nèi)容的內(nèi)容熱度和內(nèi)容源的內(nèi)容更新率動(dòng)態(tài)調(diào)整其爬取周期,并依據(jù)更新后的爬取周期對內(nèi)容源進(jìn)行內(nèi)容爬取和緩存;
其中,所述動(dòng)態(tài)調(diào)整爬取周期的原則為:當(dāng)某類視頻內(nèi)容的本地?zé)岫仍龈呋騼?nèi)容源更新率增高時(shí),就縮短該類視頻內(nèi)容的爬取周期;而當(dāng)某類視頻內(nèi)容的本地?zé)岫冉档突騼?nèi)容源更新率降低時(shí),則增大該類視頻內(nèi)容的爬取周期。
2.根據(jù)權(quán)利要求1所述的視頻內(nèi)容爬取方法,其特征在于,所述步驟101)之前還包含如下步驟:
并行從各個(gè)內(nèi)容源上爬取元信息,基于元信息并根據(jù)視頻的內(nèi)容主題、內(nèi)容名稱或內(nèi)容標(biāo)簽將視頻內(nèi)容對視頻進(jìn)行分類。
3.根據(jù)權(quán)利要求1所述的視頻內(nèi)容爬取方法,其特征在于,所述步驟102)進(jìn)一步包含如下子步驟:
步驟102-1)在當(dāng)前設(shè)定的爬取周期內(nèi),統(tǒng)計(jì)所有類視頻內(nèi)容的本地訪問請求次數(shù),當(dāng)在某段設(shè)定時(shí)間內(nèi)某類視頻內(nèi)容的訪問請求次數(shù)高于第一設(shè)定閾值時(shí),縮短該類視頻內(nèi)容當(dāng)前設(shè)定的爬取周期;當(dāng)在某段設(shè)定時(shí)間段內(nèi)對某類視頻內(nèi)容的訪問請求次數(shù)小于第二設(shè)定閾值時(shí),增大為該類視頻內(nèi)容設(shè)定的爬取周期;
步驟102-2)在一定的周期內(nèi),統(tǒng)計(jì)所有類視頻內(nèi)容的內(nèi)容源更新率,當(dāng)更新率高于第三設(shè)定閾值時(shí),縮短爬取周期;當(dāng)更新率低于第四設(shè)定閾值時(shí),增大爬取周期。
4.根據(jù)權(quán)利要求1或3所述的視頻內(nèi)容爬取方法,其特征在于,縮短或增大的爬取周期的增量值ΔT為:
ΔT=-αΔAccessed-βΔUpdated+γ
其中,ΔAccessed表示統(tǒng)計(jì)得到的上個(gè)爬取周期內(nèi)此類內(nèi)容訪問率,ΔUpdated表示統(tǒng)計(jì)得到的上個(gè)周期內(nèi)容源更新率,α、β和γ為調(diào)整倍率因子。
5.根據(jù)權(quán)利要求4所述的視頻內(nèi)容爬取方法,其特征在于,所述調(diào)整倍率因子的取值結(jié)合實(shí)際的業(yè)務(wù)確定。
6.一種并行內(nèi)容源爬取方法,所述方法包含:
步驟201)設(shè)定各內(nèi)容源的初始爬取周期;
步驟202)按初始設(shè)定周期進(jìn)行內(nèi)容源的元數(shù)據(jù)爬取;
步驟203)計(jì)算內(nèi)容源的內(nèi)容更新率;
步驟204)依據(jù)更新率調(diào)整設(shè)定的爬取周期,即:當(dāng)內(nèi)容源更新率增高時(shí),縮短其爬取周期;當(dāng)內(nèi)容源更新率降低時(shí),增大其爬取周期。
7.根據(jù)權(quán)利要求6所述的內(nèi)容源數(shù)據(jù)爬取方法,其特征在于,所述更新率的獲取方式為:將新爬取的元數(shù)據(jù)與本地已緩存的元數(shù)據(jù)進(jìn)行比較,得出周期內(nèi)容源的內(nèi)容更新數(shù),對周期進(jìn)行歸一,得出更新率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院聲學(xué)研究所;上海尚恩華科網(wǎng)絡(luò)科技股份有限公司,未經(jīng)中國科學(xué)院聲學(xué)研究所;上海尚恩華科網(wǎng)絡(luò)科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310022725.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
H04N 圖像通信,如電視
H04N21-00 可選的內(nèi)容分發(fā),例如交互式電視,VOD〔視頻點(diǎn)播〕
H04N21-20 .專門適用于內(nèi)容分發(fā)的專用服務(wù)器,例如:VOD服務(wù)器;其操作
H04N21-40 .專門適用于接收內(nèi)容或者與內(nèi)容交互的客戶端設(shè)備,如STB[機(jī)頂盒];相關(guān)操作
H04N21-60 .用于在服務(wù)器和客戶端之間或者在遠(yuǎn)程客戶端之間的視頻分配的網(wǎng)絡(luò)結(jié)構(gòu)或者處理
H04N21-80 .通過內(nèi)容產(chǎn)生器獨(dú)立于分配過程實(shí)現(xiàn)的內(nèi)容或附加數(shù)據(jù)的生成或處理;內(nèi)容本身
H04N21-81 ..其單媒體部件
- 內(nèi)容再現(xiàn)系統(tǒng)、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容提供裝置、內(nèi)容再現(xiàn)程序和內(nèi)容提供程序
- 內(nèi)容記錄系統(tǒng)、內(nèi)容記錄方法、內(nèi)容記錄設(shè)備和內(nèi)容接收設(shè)備
- 內(nèi)容服務(wù)系統(tǒng)、內(nèi)容服務(wù)器、內(nèi)容終端及內(nèi)容服務(wù)方法
- 內(nèi)容分發(fā)系統(tǒng)、內(nèi)容分發(fā)裝置、內(nèi)容再生終端及內(nèi)容分發(fā)方法
- 內(nèi)容發(fā)布、內(nèi)容獲取的方法、內(nèi)容發(fā)布裝置及內(nèi)容傳播系統(tǒng)
- 內(nèi)容提供裝置、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法
- 內(nèi)容傳輸設(shè)備、內(nèi)容傳輸方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容發(fā)送設(shè)備、內(nèi)容發(fā)送方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法、內(nèi)容再現(xiàn)程序及內(nèi)容提供系統(tǒng)
- 內(nèi)容記錄裝置、內(nèi)容編輯裝置、內(nèi)容再生裝置、內(nèi)容記錄方法、內(nèi)容編輯方法、以及內(nèi)容再生方法
- 一種視頻內(nèi)容及內(nèi)容源爬取方法
- 基于動(dòng)態(tài)爬蟲技術(shù)的數(shù)據(jù)源發(fā)現(xiàn)方法
- 一種面向移動(dòng)互聯(lián)網(wǎng)自適應(yīng)增量的內(nèi)容聚合方法及系統(tǒng)
- 面向軟件項(xiàng)目的多源異構(gòu)數(shù)據(jù)自動(dòng)收集方法及系統(tǒng)
- 數(shù)據(jù)爬取方法、數(shù)據(jù)爬取裝置、數(shù)據(jù)爬取設(shè)備及存儲介質(zhì)
- 一種基于多數(shù)據(jù)源的論文數(shù)據(jù)爬取方法及系統(tǒng)
- 一種數(shù)據(jù)爬取方法、裝置、設(shè)備和介質(zhì)
- 一種基于固定電話爬取信息的方法、計(jì)算設(shè)備及存儲介質(zhì)
- 網(wǎng)站資源獲取方法、系統(tǒng)、裝置及計(jì)算機(jī)存儲介質(zhì)
- 自動(dòng)生成新聞?lì)l道信息的方法、裝置、設(shè)備及存儲介質(zhì)





