[發明專利]一種基于大數據的智能預測方法在審
| 申請號: | 201910458583.5 | 申請日: | 2019-05-29 |
| 公開(公告)號: | CN110378508A | 公開(公告)日: | 2019-10-25 |
| 發明(設計)人: | 劉治;孫澤勇;章云;賴有仿 | 申請(專利權)人: | 廣東工業大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q30/06;G06Q50/16;G06F16/215;G06N20/00 |
| 代理公司: | 廣東廣信君達律師事務所 44329 | 代理人: | 杜鵬飛 |
| 地址: | 510062 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 智能預測 大數據 預測 預處理 模型預測結果 人工智能 創新能力 機器學習 模型構建 模型融合 模型算法 市場變化 市場需求 數據清洗 統計特征 原始數據 最終模型 運營商 權重 加權 清洗 房屋 分類 配置 分析 | ||
本發明公開了一種基于大數據的智能預測方法,包括下述步驟:步驟一,數據清洗;對原始數據進行預處理;步驟二,特征工程;對清洗過的數據進行分析并找出重要特征,構造與其相關的統計特征;步驟三,模型構建;使用分類精度較高的XGboost、LightGBM和catboost模型對房租進行預測;步驟四,模型融合;根據模型預測結果的得分,給與其不同的權重,加權組成最終模型,提高模型泛化能力;步驟五,智能預測;利用所得模型來實現房租的準確預測;本發明利用房產市場、租賃市場、市場需求以及房屋配置等數據,運用機器學習、人工智能等模型算法,結合模型的創新能力,做出合理的房租預測,以應對市場變化對運營商和房產機構帶來的影響。
技術領域
本發明涉及大數據及機器學習技術領域,具體涉及一種基于大數據的智能預測方法。
背景技術
近幾年,國內住房租賃市場進入全新的發展階段,長期公寓市場作為租賃市場的重要部分,越來越受到廣泛的關注。但同時中國長期公寓市場也面臨著企業市場進入、業務(門店)擴張、資本市場博弈、企業重組并購等多重挑戰,其中,如何準確的預測租金便成為該行業發展進程中的一大難題;房屋租金的確定,需要結合房產市場、租賃市場、市場需求、位置地段以及房屋配置等多方面因素來確定,而現有技術中并沒有公開相關房屋租金的預測手段,租借方無法有效預測市場的變化,從而做出合理的決策。
發明內容
本發明的目的在于克服現有技術的缺點與不足,提供一種基于大數據的智能預測方法,該方法能夠利用房產市場、租賃市場、市場需求以及房屋配置等數據,運用機器學習、人工智能等模型算法,結合模型的創新能力,做出合理的房租預測,以應對市場變化對運營商和房產機構帶來的影響。
本發明的目的通過下述技術方案實現:
一種基于大數據的智能預測方法,包括下述步驟:
步驟一,數據清洗;對原始數據進行預處理,包括異常數據的處理及缺失值的填補;
步驟二,特征工程;對清洗過的數據進行分析并找出重要特征,嘗試構造出與房租相關性強的組合特征,并對類別特征進行統計,構造與其相關的統計特征;
步驟三,模型構建;使用分類精度較高的XGboost、LightGBM和catboost模型對房租進行預測;
步驟四,模型融合;根據模型預測結果的得分,給與其不同的權重,得分越高權重越大,加權組成最終模型,提高模型泛化能力;
步驟五,智能預測;利用所得模型來實現房租的準確預測。
優選的,所述步驟一數據清洗的具體步驟為:
(1)異常值處理;通過畫散點圖和箱型圖的方法同時結合數據本身的業務含義,對異常數據進行剔除或者當作缺失值處理;
(2)填充缺失值;離散型變量的空值用null填充,連續型變量用平均值填充。
本發明與現有技術相比具有以下的有益效果:
本發明利用房產市場、租賃市場、市場需求以及房屋配置等數據,運用機器學習、人工智能等模型算法,結合模型的創新能力,做出合理的房租預測,以應對市場變化對運營商和房產機構帶來的影響;本發明將XGboost、LightGBM、catboost三個模型融合在一起,預測結果的線下和線上分數均有顯著提升,實現了預測精度和模型穩健性的統一,具有更強的泛化能力。
附圖說明
圖1為本發明的流程示意圖;
圖2為本發明剔除異常值后租金分布圖;
圖3為本發明area與tradeMoney散點圖;
圖4為本發明原始特征重要性排序;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東工業大學,未經廣東工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910458583.5/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





