[發(fā)明專(zhuān)利]一種計(jì)算指標(biāo)數(shù)據(jù)的方法和裝置在審
| 申請(qǐng)?zhí)枺?/td> | 202210895954.8 | 申請(qǐng)日: | 2022-07-27 |
| 公開(kāi)(公告)號(hào): | CN115828075A | 公開(kāi)(公告)日: | 2023-03-21 |
| 發(fā)明(設(shè)計(jì))人: | 宋禮;張鈞波;鄭宇 | 申請(qǐng)(專(zhuān)利權(quán))人: | 京東城市(北京)數(shù)字科技有限公司 |
| 主分類(lèi)號(hào): | G06F18/21 | 分類(lèi)號(hào): | G06F18/21;G06N20/00 |
| 代理公司: | 中原信達(dá)知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11219 | 代理人: | 王安娜;李陽(yáng) |
| 地址: | 100086 北京市海淀區(qū)知*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 計(jì)算 指標(biāo) 數(shù)據(jù) 方法 裝置 | ||
本發(fā)明公開(kāi)了一種計(jì)算指標(biāo)數(shù)據(jù)的方法和裝置,涉及大數(shù)據(jù)技術(shù)領(lǐng)域。該方法的一具體實(shí)施方式包括:篩選出與待測(cè)時(shí)序數(shù)據(jù)相近的樣本時(shí)序數(shù)據(jù),對(duì)所述樣本時(shí)序數(shù)據(jù)進(jìn)行特征提取,從而構(gòu)建數(shù)據(jù)集;其中,所述待測(cè)時(shí)序數(shù)據(jù)對(duì)應(yīng)的指標(biāo)與所述樣本時(shí)序數(shù)據(jù)對(duì)應(yīng)的指標(biāo)不同,且所述待測(cè)時(shí)序數(shù)據(jù)條目數(shù)量少于所述樣本時(shí)序數(shù)據(jù)的條目數(shù)量;采用所述數(shù)據(jù)集對(duì)指標(biāo)計(jì)算模型進(jìn)行訓(xùn)練,得到訓(xùn)練后的指標(biāo)計(jì)算模型;從所述待測(cè)時(shí)序數(shù)據(jù)中提取出待測(cè)特征,將所述待測(cè)特征輸入到所述訓(xùn)練后的指標(biāo)計(jì)算模型中,從而輸出指標(biāo)數(shù)據(jù)。該實(shí)施方式能夠解決人力和時(shí)間消耗大以及數(shù)據(jù)稀疏的技術(shù)問(wèn)題。
技術(shù)領(lǐng)域
本發(fā)明涉及大數(shù)據(jù)技術(shù)領(lǐng)域,尤其涉及一種計(jì)算指標(biāo)數(shù)據(jù)的方法和裝置。
背景技術(shù)
隨著大數(shù)據(jù)和智能化系統(tǒng)的發(fā)展,城市趨于智能化,指標(biāo)計(jì)算是城市智能化不可或缺的一個(gè)部分,對(duì)于城市發(fā)展的分析研判,資源調(diào)度等起到至關(guān)重要的作用。
在實(shí)現(xiàn)本發(fā)明過(guò)程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在如下問(wèn)題:
1)大量的人力消耗和時(shí)間消耗:城市中的指標(biāo)是眾多的,然而目前常用的方法是針對(duì)每種指標(biāo)單獨(dú)設(shè)計(jì)一個(gè)機(jī)器學(xué)習(xí)或深度學(xué)習(xí)模型來(lái)對(duì)數(shù)據(jù)擬合(訓(xùn)練階段),從而完成對(duì)指標(biāo)的計(jì)算(推理階段)。針對(duì)一個(gè)具體的需求場(chǎng)景,如社會(huì)零售額預(yù)測(cè)、銷(xiāo)量預(yù)測(cè)等,數(shù)據(jù)采集階段通常從子系統(tǒng)接入數(shù)據(jù),特征提取階段通常采用滑動(dòng)窗口的方式,模型訓(xùn)練通常使用現(xiàn)有的開(kāi)源算法庫(kù)支持,如sklearn等,模型推理階段使用最近的特征實(shí)現(xiàn)對(duì)指標(biāo)的計(jì)算。上述過(guò)程需要利用人為經(jīng)驗(yàn)對(duì)每個(gè)指標(biāo)進(jìn)行建模,往往需要巨大的人力消耗和時(shí)間消耗。
2)數(shù)據(jù)的稀疏性:城市中的指標(biāo)多為宏觀指標(biāo),歷史數(shù)據(jù)的時(shí)間段比較有限,在數(shù)據(jù)稀疏的情況下,通常較難使用復(fù)雜的機(jī)器學(xué)習(xí)或深度學(xué)習(xí)模型。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實(shí)施例提供一種計(jì)算指標(biāo)數(shù)據(jù)的方法和裝置,以解決人力和時(shí)間消耗大以及數(shù)據(jù)稀疏的技術(shù)問(wèn)題。
為實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明實(shí)施例的一個(gè)方面,提供了一種計(jì)算指標(biāo)數(shù)據(jù)的方法,包括:
篩選出與待測(cè)時(shí)序數(shù)據(jù)相近的樣本時(shí)序數(shù)據(jù),對(duì)所述樣本時(shí)序數(shù)據(jù)進(jìn)行特征提取,從而構(gòu)建數(shù)據(jù)集;其中,所述待測(cè)時(shí)序數(shù)據(jù)對(duì)應(yīng)的指標(biāo)與所述樣本時(shí)序數(shù)據(jù)對(duì)應(yīng)的指標(biāo)不同,且所述待測(cè)時(shí)序數(shù)據(jù)條目數(shù)量少于所述樣本時(shí)序數(shù)據(jù)的條目數(shù)量;
采用所述數(shù)據(jù)集對(duì)指標(biāo)計(jì)算模型進(jìn)行訓(xùn)練,得到訓(xùn)練后的指標(biāo)計(jì)算模型;
從所述待測(cè)時(shí)序數(shù)據(jù)中提取出待測(cè)特征,將所述待測(cè)特征輸入到所述訓(xùn)練后的指標(biāo)計(jì)算模型中,從而輸出指標(biāo)數(shù)據(jù)。
可選地,篩選出與待測(cè)時(shí)序數(shù)據(jù)相近的樣本時(shí)序數(shù)據(jù),包括:
將待測(cè)時(shí)序數(shù)據(jù)以及各個(gè)樣本時(shí)序數(shù)據(jù)輸入到經(jīng)過(guò)訓(xùn)練的編碼器中,分別輸出所述待測(cè)時(shí)序數(shù)據(jù)對(duì)應(yīng)的編碼向量以及所述各個(gè)樣本時(shí)序數(shù)據(jù)對(duì)應(yīng)的編碼向量;
采用聚類(lèi)算法對(duì)所述各個(gè)樣本時(shí)序數(shù)據(jù)對(duì)應(yīng)的編碼向量進(jìn)行聚類(lèi),得到多個(gè)簇以及各個(gè)簇對(duì)應(yīng)的特征中心向量;
基于所述待測(cè)時(shí)序數(shù)據(jù)對(duì)應(yīng)的編碼向量以及所述各個(gè)簇對(duì)應(yīng)的特征中心向量,篩選出與所述待測(cè)時(shí)序數(shù)據(jù)相近的若干個(gè)樣本時(shí)序數(shù)據(jù)。
可選地,所述簇的數(shù)量為所述各個(gè)樣本時(shí)序數(shù)據(jù)的總數(shù)量的平方根。
可選地,基于所述待測(cè)時(shí)序數(shù)據(jù)對(duì)應(yīng)的編碼向量以及所述各個(gè)簇對(duì)應(yīng)的特征中心向量,篩選出與所述待測(cè)時(shí)序數(shù)據(jù)相近的若干個(gè)樣本時(shí)序數(shù)據(jù),包括:
分別計(jì)算所述待測(cè)時(shí)序數(shù)據(jù)對(duì)應(yīng)的編碼向量與所述各個(gè)簇對(duì)應(yīng)的特征中心向量的相似度,篩選出與所述待測(cè)時(shí)序數(shù)據(jù)相似度最大的N個(gè)簇;
分別計(jì)算所述待測(cè)時(shí)序數(shù)據(jù)對(duì)應(yīng)的編碼向量與所述N個(gè)簇中每個(gè)樣本時(shí)序數(shù)據(jù)對(duì)應(yīng)的編碼向量的相似度,篩選出與所述待測(cè)時(shí)序數(shù)據(jù)相似度最大的M個(gè)樣本時(shí)序數(shù)據(jù);
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于京東城市(北京)數(shù)字科技有限公司,未經(jīng)京東城市(北京)數(shù)字科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210895954.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線(xiàn)程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





