[發明專利]一種基于大數據的油價信息對比系統及方法在審
| 申請號: | 201811602285.0 | 申請日: | 2018-12-26 |
| 公開(公告)號: | CN109947937A | 公開(公告)日: | 2019-06-28 |
| 發明(設計)人: | 程國艮;李欣然 | 申請(專利權)人: | 中譯語通科技股份有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06K9/62;G06Q30/02 |
| 代理公司: | 北京萬貝專利代理事務所(特殊普通合伙) 11520 | 代理人: | 馬紅 |
| 地址: | 100040 北京市石*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 油價信息 大數據 數據處理模塊 數據判斷模塊 信息終端模塊 對比系統 加油站 日志收集模塊 數據儲存模塊 數據分析模塊 網絡數據收集 信息處理模塊 耗油量 查詢指令 工作運行 模塊連接 收集模塊 行為數據 用戶網路 綜合分析 路況 發送 查詢 分析 協調 幫助 | ||
1.一種基于大數據的油價信息對比方法,其特征在于,所述基于大數據的油價信息對比方法包括:
步驟一,首先,利用網絡、日志、用戶網絡行為,獲取油價的數據信息;
步驟二,根據獲取的油價數據信息,進行分析,對采集的油價數據,進行判斷是否是真實的油價,判斷出不是真實的油價,偏離正常的油價范圍,油價無效,不進行處理和儲存輸出;
步驟三,對搜集的油價數據進行比對,得出油價的分布情況;
步驟四,對采集的油價信息和油價分布數據進行儲存,并通過顯示屏顯示出油價的分布結果。
2.如權利要求1所述的基于大數據的油價信息對比方法,其特征在于,利用儲存器儲存搜集的各種油價數據,進行數據分類儲存,對整個數據集在保持分布的情況下進行欠采樣處理減少訓練的數據,降低數據集的規模,進行數據分類中采用RSBoost算法進行不平衡數據分類,具體包括:
給定訓練集S={(x1,y1),(x2,y2),…,(xm,ym)},樣本xi∈Xd是d維特征向量,類標記yi∈{P,N},其中P對應少數類,N對應多數類;
輸入:訓練集St,基分類模塊WL,過采樣率M,欠采樣率N;
輸出:分類模型H(x);
步驟一,初始化數據集中樣本的權重:
D1(i)=l/m;
步驟二,根據過采樣率M對少數類進行SMOTE過采樣處理后,在保持數據分布的情況下以欠采樣率N對整個數據集進行隨機欠采樣處理,生成訓練數據集St′,其權重分布為Dt′;
步驟三,fort=1toT;
(1)根據訓練數據集St′及其權重分布Dt′,訓練弱分類模塊WL,并計算弱假設ht:X×Y→[0,1];
(2)計算ht的偽損失:
(3)計算權重更新參數:
ωt=(1/2)·(1+ht(xi,yi)-ht(xi,y));
(4)更新權重分布Dt
(5)歸一化處理:
步驟四,通過T個弱假設權重投票得到最終分類模型:
3.如權利要求1所述的基于大數據的油價信息對比方法,其特征在于,采集油價數據,進行判斷是否是真實的油價的過程中,對異常的油價數據進行識別,采用DBSCAN算法進行識別,具體包括:
步驟一,檢查數據中沒有被訪問的數據對象P且這個數據對象沒有處理過,檢查它的Eps領域NEps(p),如果其NEps(p)領域內包含的數據對象數目大于或等于Minpts,則建立新簇C,并將P及其領域內包含的數據對象并入C中;
步驟二,如果C中有未被處理的數據對象Q,檢查它的Eps領域NEps(p),若果其NEps(p)領域內包含的數據對象大于等于Minpts,將Q及其領域內包含的點代入C;
步驟三,重復步驟二,直到C中的對象都被處理過;
步驟四,重復步驟一到步驟三直到所有數據對象都被訪問過,且所有的數據對象都標記為某個簇或者被認為是異常數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中譯語通科技股份有限公司,未經中譯語通科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811602285.0/1.html,轉載請聲明來源鉆瓜專利網。





