[發明專利]流感預測模型的生成方法、裝置及計算機可讀存儲介質在審
| 申請號: | 201810543750.1 | 申請日: | 2018-05-31 |
| 公開(公告)號: | CN108831561A | 公開(公告)日: | 2018-11-16 |
| 發明(設計)人: | 李弦;徐亮;阮曉雯;肖京 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G16H50/80 | 分類號: | G16H50/80 |
| 代理公司: | 深圳市沃德知識產權代理事務所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 候選特征 預測模型 流感 預測 計算機可讀存儲介質 小波去噪處理 集合 目標區域 數據序列 特征集合 預設 關鍵詞獲取 模型參數 趨勢處理 生成裝置 時間單元 算法構建 訓練樣本 準確度 構建 匹配 篩選 | ||
1.一種流感預測模型的生成方法,其特征在于,所述方法包括:
確定待預測的目標區域以及與流感預測匹配的輿情關鍵詞,根據所述輿情關鍵詞獲取所述目標區域在連續多個時間單元內的輿情數據序列,并將所述輿情數據序列中的輿情數據作為候選特征,構建候選特征集合;
對所述候選特征集合中的候選特征進行小波去噪處理;
對經過小波去噪處理后的候選特征集合中的候選特征進行去趨勢處理,獲取去趨勢處理后的候選特征集合;
確定特征的預設數量,并從候選特征集合中篩選出等于所述預設數量的候選特征,構成預測特征集合;
獲取所述連續多個時間單元內的流感樣病例百分比的實際觀測值,根據所述預測特征集合和所述實際觀測值作為訓練樣本,訓練基于xgboost算法構建的預測模型以確定模型參數,并將確定了模型參數的所述預測模型作為流感預測模型。
2.如權利要求1所述的流感預測模型的生成方法,其特征在于,所述對所述候選特征集合中的候選特征進行小波去噪處理的步驟包括:
確定小波基函數,按照所述小波基函數對所述候選特征集合中的每個特征形成的序列進行小波分解,并確定分解層數;
確定小波去噪的閾值,按照確定的閾值對小波分解后的預測特征的各層次的系數進行調整;
對調整過的小波系數做逆變換重構,得到去噪之后的候選特征。
3.如權利要求1所述的流感預測模型的生成方法,其特征在于,所述對經過小波去噪處理后的候選特征集合中的候選特征進行去趨勢處理,獲取去趨勢處理后的候選特征集合的步驟包括:
針對小波去噪處理后的候選特征集合中每個時間單元對應的候選特征,獲取該時間單元之前的連續多個時間單元的數據進行線性回歸,以構建趨勢預測模型,根據所述趨勢預測模型獲取該時間單元對應的基線預測值;
使用該時間單元的候選特征的實際值減去所述基線預測值,得到去趨勢之后的候選特征。
4.如權利要求1至3中任一項所述的流感預測模型的生成方法,其特征在于,所述確定特征的預設數量的步驟包括:
基于xgboost算法構建模型作為學習器,將所述候選特征集合中的候選特征輸入所述學習器,使用特征遞歸消除交叉驗證算法選擇模型性能達到預設條件時的特征數量作為所述預設數量。
5.如權利要求4所述的流感預測模型的生成方法,其特征在于,所述從候選特征集合中篩選出等于所述預設數量的候選特征,構成預測特征集合的步驟包括:
基于xgboost算法構建模型作為學習器,將所述候選特征集合中的候選特征輸入所述學習器,并按照特征遞歸消除算法進行迭代運算;
獲取所述學習器經過運算返回的模型系數,根據所述模型系數確定每個候選特征集合中各候選特征的重要程度;
根據各候選特征的重要程度從當前的候選特征集合中移除重要程度最小的K個候選特征;
重復執行上述步驟,直至篩選得到的候選特征的數量達到所述預設數量;
所述預設數量的候選特征構成預測特征集合。
6.一種流感預測模型的生成裝置,其特征在于,所述裝置包括存儲器和處理器,所述存儲器上存儲有可在所述處理器上運行的模型生成程序,所述模型生成程序被所述處理器執行時實現如下步驟:
確定待預測的目標區域以及與流感預測匹配的輿情關鍵詞,根據所述輿情關鍵詞獲取所述目標區域在連續多個時間單元內的輿情數據序列,并將所述輿情數據序列中的輿情數據作為候選特征,構建候選特征集合;
對所述候選特征集合中的候選特征進行小波去噪處理;
對經過小波去噪處理后的候選特征集合中的候選特征進行去趨勢處理,獲取去趨勢處理后的候選特征集合;
確定特征的預設數量,并從候選特征集合中篩選出等于所述預設數量的候選特征,構成預測特征集合;
獲取所述連續多個時間單元內的流感樣病例百分比的實際觀測值,根據所述預測特征集合和所述實際觀測值作為訓練樣本,訓練基于xgboost算法構建的預測模型以確定模型參數,并將確定了模型參數的所述預測模型作為流感預測模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810543750.1/1.html,轉載請聲明來源鉆瓜專利網。





