[發(fā)明專利]一種面向開源信息采集的資源更新時(shí)間預(yù)測(cè)方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201910371392.5 | 申請(qǐng)日: | 2019-05-06 |
| 公開(公告)號(hào): | CN110069692B | 公開(公告)日: | 2021-04-20 |
| 發(fā)明(設(shè)計(jì))人: | 姚晗;晏裕生;孫孟陽;董文軒;江洋 | 申請(qǐng)(專利權(quán))人: | 中國船舶工業(yè)綜合技術(shù)經(jīng)濟(jì)研究院 |
| 主分類號(hào): | G06F16/951 | 分類號(hào): | G06F16/951;G06K9/62;G06Q10/04 |
| 代理公司: | 北京高沃律師事務(wù)所 11569 | 代理人: | 程華 |
| 地址: | 100081 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 面向 信息 采集 資源 更新 時(shí)間 預(yù)測(cè) 方法 系統(tǒng) | ||
1.一種面向開源信息采集的資源更新時(shí)間預(yù)測(cè)方法,其特征在于,所述方法包括:
獲取目標(biāo)網(wǎng)站的歷史數(shù)據(jù);所述歷史數(shù)據(jù)包括多個(gè)歷史更新時(shí)間以及多個(gè)所述歷史更新時(shí)間對(duì)應(yīng)的歷史資源更新數(shù)量;
采用十折交叉法將所述歷史數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集;
根據(jù)所述訓(xùn)練集建立分類與回歸樹CART決策樹模型;
所述根據(jù)所述訓(xùn)練集建立分類與回歸樹CART決策樹模型,具體包括:
統(tǒng)計(jì)所述訓(xùn)練集中所有歷史更新時(shí)間作為定義域;所述訓(xùn)練集中包括多個(gè)歷史更新時(shí)間以及多個(gè)所述歷史更新時(shí)間對(duì)應(yīng)的歷史資源更新數(shù)量;
對(duì)所述定義域進(jìn)行遞歸劃分,將所述定義域劃分為M個(gè)集合R1,R2,...,RM;
確定所述定義域的最優(yōu)切分變量與最優(yōu)切分點(diǎn);
采用所述最優(yōu)切分點(diǎn)將所述定義域劃分為兩個(gè)子區(qū)域;
將兩個(gè)所述子區(qū)域分別作為所述定義域,返回所述對(duì)所述定義域進(jìn)行遞歸劃分,將所述定義域劃分為M個(gè)集合R1,R2,...,RM的步驟,對(duì)所述定義域進(jìn)行遞歸劃分,直到滿足終止條件,將所述定義域劃分為M個(gè)集合R1,R2,...,RM;
根據(jù)所述M個(gè)集合R1,R2,...,RM建立CART決策樹模型其中xi為歷史更新時(shí)間;Rm表示所述M個(gè)集合中的第m個(gè)集合;Cm為第m個(gè)集合Rm的回歸值;Nm表示第m個(gè)集合Rm中的元素個(gè)數(shù);yi為歷史更新時(shí)間xi對(duì)應(yīng)的歷史資源更新數(shù)量;f(xi)為與歷史更新時(shí)間xi對(duì)應(yīng)的更新時(shí)間所對(duì)應(yīng)的預(yù)測(cè)資源更新數(shù)量;
根據(jù)所述測(cè)試集確定所述CART決策樹模型的準(zhǔn)確性;
根據(jù)所述測(cè)試集中的數(shù)據(jù),采用公式計(jì)算所述CART決策樹模型的準(zhǔn)確性;
其中ts為平均誤差,N為定義域的元素個(gè)數(shù),f(xi)為通過所述CART決策樹模型計(jì)算出來的預(yù)測(cè)資源更新數(shù)量,yi為所述測(cè)試集中的歷史更新時(shí)間xi對(duì)應(yīng)的歷史資源更新數(shù)量;
判斷所述準(zhǔn)確性是否滿足要求,獲得第一判斷結(jié)果;
若所述第一判斷結(jié)果為所述準(zhǔn)確性滿足要求,采用所述CART決策樹模型預(yù)測(cè)所述目標(biāo)網(wǎng)站的更新時(shí)間以及所述更新時(shí)間對(duì)應(yīng)的資源更新數(shù)量;
若所述第一判斷結(jié)果為所述準(zhǔn)確性不滿足要求,返回所述采用十折交叉法將所述歷史數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集的步驟。
2.根據(jù)權(quán)利要求1所述的資源更新時(shí)間預(yù)測(cè)方法,其特征在于,所述判斷所述準(zhǔn)確性是否滿足要求,獲得第一判斷結(jié)果,具體包括:
判斷所述平均誤差ts是否小于誤差閾值,獲得第二判斷結(jié)果;
若所述第二判斷結(jié)果為所述平均誤差ts小于誤差閾值,確定所述第一判斷結(jié)果為所述準(zhǔn)確性滿足要求;
若所述第二判斷結(jié)果為所述平均誤差ts不小于誤差閾值,確定所述第一判斷結(jié)果為所述準(zhǔn)確性不滿足要求。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國船舶工業(yè)綜合技術(shù)經(jīng)濟(jì)研究院,未經(jīng)中國船舶工業(yè)綜合技術(shù)經(jīng)濟(jì)研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910371392.5/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





