[發明專利]一種基于對數線性回歸和隨機森林的房價走勢分析方法在審
| 申請號: | 202010277368.8 | 申請日: | 2020-04-10 |
| 公開(公告)號: | CN111523086A | 公開(公告)日: | 2020-08-11 |
| 發明(設計)人: | 石建 | 申請(專利權)人: | 南通大學 |
| 主分類號: | G06F17/18 | 分類號: | G06F17/18;G06F30/27;G06F16/951;G06Q50/16;G06K9/62 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 許潔 |
| 地址: | 226000*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 對數 線性 回歸 隨機 森林 房價 走勢 分析 方法 | ||
本發明公開了一種基于對數線性回歸和隨機森林的房價走勢分析方法,包括以下步驟:步驟1.對影響因素進行分析;步驟2.獲取樓盤房價數據;步驟3.對樓盤數據進行預處理;步驟4.建立基于隨機森林的模型:調用RandomForest Classifier函數建模并訓練,對模型權重參數進行對數線性回歸檢驗,若檢驗通過且模型符合正態分布,則認為模型符合條件,根據生成的決策樹分類器對預測集進行預測,對每棵樹的預測結果求均值即為最終預測結果;步驟5.對數線性回歸測試;步驟6.模型訓練與分析評估。本發明通過建立基于對數線性回歸和隨機森林的模型,在多個房價走勢的影響因素下,達到曲線擬合精準。
技術領域
本發明涉及機器學習和數據挖掘領域,具體為一種基于對數線性回歸和隨機森林的房價走勢分析方法。
背景技術
在我國的傳統觀念中房子就家,不管住別墅還是住瓦房,每一個家庭都必須有自己的住房,因此住房問題本生就是關系國計民生的大問題。同時,隨著改革開放以來我國經濟的高速發展,人民生活質量得到了極大提高,對住房質量、住房環境、小區配套服務等的要求也隨之不斷提高。
近十年來我國一些城鎮的商品房價格上漲過快,過高的房價使城鎮卻中低收入者無力購買住房,為了社會持續穩定的發展,政府一直出臺各種文件,從宏觀層面對房地產市場進行調控。但由于各部門配合不協調,加上惡意炒房的炒家操作,房地產的價格在過去的幾年時間里快速地上漲,房價成了各種社會矛盾的焦點。
因此,面對如此的背景條件,科學的分析房價走勢成為了我們至關重要的武器。我們需要對物價水平、國內生產總值、國民收入水平、金融政策、稅收政策、土地、城市化率、各類保障性住房的投入使用等房地產價格的影響因素進行實證研究,找到影響房價的主要指標,建立模型,以此達到預測房價的效果。但總體而言,影響房價走勢的因素太多,無法非常精準的擬合出房價的走勢,難免會造成一些經濟上的損失。
發明內容
本發明的目的是為了解決現有技術的不足,提供一種基于對數線性回歸和隨機森林的房價走勢分析方法,通過建立基于對數線性回歸和隨機森林的模型,在多個房價走勢的影響因素下,達到曲線擬合精準。
為了實現上述發明目的,本發明采用了以下技術方案:一種基于對數線性回歸和隨機森林的房價走勢分析方法,包括以下步驟:步驟1.對影響因素進行分析,具體以下:確定影響房價走勢的因素,所述因素包括小區因素和客戶因素;
步驟2.獲取樓盤房價數據,具體包括以下步驟:步驟(2-1).通過端口對樓盤數據進行爬取;步驟(2-2).運用selenium庫與chromedriver模擬網頁登陸;步驟(2-3).引入time庫,對點擊時常進行限制;步驟(2-4).使用了lxml庫和pysql庫將爬取的數據導入excel中,得到data1;步驟(2-5).預設因素變量,具體如下:占地面積area、綠化率green、容積率volume和客戶評論comment;
步驟3.對樓盤數據進行預處理,具體包括以下步驟:步驟(3-1).直接刪去樓盤代碼的冗余字段;步驟(3-2).結合pandas,xlrd和xlutils庫將文本數據進行分割;步驟(3-3).設定閾值alpha,作為去冗余字段的標準值;步驟(3-4).用value_counts計算出每個字段中,各值的數量n;若n大于等于row的80%,則刪除該冗余字段;步驟(3-5).并刪除符合條件的null值和空值;步驟(3-6).利用雙線性內插法來填補剩下的異常值,至此異常值處理完畢,得到數據data2;步驟(3-7).設置隨機種子seed,利用train_test_split隨機抽取80%的data2作為訓練數據train,20%的data2作為測試數據test;步驟(3-8).train進入模型訓練;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南通大學,未經南通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010277368.8/2.html,轉載請聲明來源鉆瓜專利網。





