[發明專利]一種基于分時擬合的黑盒數據拆分方法在審
| 申請號: | 202111572316.4 | 申請日: | 2021-12-21 |
| 公開(公告)號: | CN114398265A | 公開(公告)日: | 2022-04-26 |
| 發明(設計)人: | 程磊;俞永浩;楊欣如;唐光宇;閆乃永;盧學明 | 申請(專利權)人: | 寶寶巴士股份有限公司 |
| 主分類號: | G06F11/36 | 分類號: | G06F11/36;G06K9/62;G06Q30/02 |
| 代理公司: | 北京易捷勝知識產權代理事務所(普通合伙) 11613 | 代理人: | 蔡曉敏 |
| 地址: | 350000 福建省福州市倉山*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 分時 擬合 黑盒 數據 拆分 方法 | ||
1.一種基于分時擬合的黑盒數據拆分方法,其特征在于,包括:
S1、將數據集中的部分數據劃分為訓練集,按照星期幾、單位時間段分類整理所述訓練集的自然新增用戶數據,其中,一天劃分有多個單位時間段;
S2、分別根據某一單位時間段的自然新增用戶數據與下一單位時間段的自然新增用戶數據多次訓練計算得到所述某一單位時間段的數據模型,最終得到所有單位時間段的數據模型;
所述數據模型用于根據某一時間段的新增用戶數據預測下一單位時間段的自然新增用戶數據。
2.根據權利要求1所述的基于分時擬合的黑盒數據拆分方法,其特征在于,所述S1中還包括:
將數據集中的另一部分數據劃分為測試集,按照星期幾、單位時間段分類整理所述測試集的自然新增用戶數據;
分別將所述數據模型對應代入至所述測試集的某一單位時間段的自然新增用戶數據,預測下一單位時間段的自然新增用戶數據,基于預測的下一單位時間段的自然新增用戶數據與所述測試集對應的實際的下一單位時間段的自然新增用戶數據進行對比,若對比結果超過預設閾值,則標記所述數據模型。
3.根據權利要求1所述的基于分時擬合的黑盒數據拆分方法,其特征在于,以小時段H作為時間單位段。
4.根據權利要求3所述的基于分時擬合的黑盒數據拆分方法,其特征在于,所述數據模型的建立過程如下:
S21、確定自變量X和因變量Y;
所述自變量X中的參數有:星期幾W、單位時間段H和所述單位時間段內的自然新增用戶實際數據x;
所述因變量Y中的參數有:星期幾W、單位時間段H+1和所述單位時間段內的自然新增用戶的實際數據y;
S22、建立單位時間段H+1內自然新增用戶的實際數據y與單位時間段H內自然新增用戶實際數據x的回歸方程作為所述數據模型的模型方程:
hθ(x)=θ0+θ1·x,所述θ0為常數項,θ1為回歸系數,hθ(x)用于基于單位時間段H自然新增用戶實際數據x來計算出單位時間段H+1自然新增用戶的預測數據;
S23、J(θ)是關于參數θ0、θ1的代價函數,是為了計算自然新增用戶的預測數據hθ(x)與自然新增用戶的實際數據y之間最小的殘差平方和,計算過程如下:
S23、根據梯度下降算法,計算出使J(θ0,θ1)的值最小的θ0和θ1:
上述為偏導數,α為梯度下降學習率;
根據以上迭代過程,當迭代次數達到預設次數或者當前后兩次迭代結果的差值小于預設迭代閾值時,迭代結束,最終確定參數θ0與θ1的值,從而確定了回歸方程的表達式,數據模型建立完成。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于寶寶巴士股份有限公司,未經寶寶巴士股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111572316.4/1.html,轉載請聲明來源鉆瓜專利網。





