[發明專利]一種基于對數線性回歸和隨機森林的房價走勢分析方法在審
| 申請號: | 202010277368.8 | 申請日: | 2020-04-10 |
| 公開(公告)號: | CN111523086A | 公開(公告)日: | 2020-08-11 |
| 發明(設計)人: | 石建 | 申請(專利權)人: | 南通大學 |
| 主分類號: | G06F17/18 | 分類號: | G06F17/18;G06F30/27;G06F16/951;G06Q50/16;G06K9/62 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 許潔 |
| 地址: | 226000*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 對數 線性 回歸 隨機 森林 房價 走勢 分析 方法 | ||
1.一種基于對數線性回歸和隨機森林的房價走勢分析方法,其特征在于:包括以下步驟:步驟1.對影響因素進行分析,具體以下:確定影響房價走勢的因素,所述因素包括小區因素和客戶因素;
步驟2.獲取樓盤房價數據,具體包括以下步驟:步驟(2-1).通過端口對樓盤數據進行爬?。徊襟E(2-2).運用selenium庫與chromedriver模擬網頁登陸;步驟(2-3).引入time庫,對點擊時常進行限制;步驟(2-4).使用了lxml庫和pysql庫將爬取的數據導入excel中,得到data1;步驟(2-5).預設因素變量,具體如下:占地面積area、綠化率green、容積率volume和客戶評論comment;
步驟3.對樓盤數據進行預處理,具體包括以下步驟:步驟(3-1).直接刪去樓盤代碼的冗余字段;步驟(3-2).結合pandas,xlrd和xlutils庫將文本數據進行分割;步驟(3-3).設定閾值alpha,作為去冗余字段的標準值;步驟(3-4).用value_counts計算出每個字段中,各值的數量n;若n大于等于row的80%,則刪除該冗余字段;步驟(3-5).并刪除符合條件的null值和空值;步驟(3-6).利用雙線性內插法來填補剩下的異常值,至此異常值處理完畢,得到數據data2;步驟(3-7).設置隨機種子seed,利用train_test_split隨機抽取80%的data2作為訓練數據train,20%的data2作為測試數據test;步驟(3-8).train進入模型訓練;
步驟4.建立基于隨機森林的模型,具體包括以下步驟:步驟(4-1).確定生成一棵決策樹時用到的特征變量數目m;步驟(4-2).應用bootstrap法有放回隨機抽取k個新的自助樣本集,并由此構建k棵決策樹,每次未被抽到的樣本組成k個袋外數據;步驟(4-3).每個自助樣本集生長為單棵決策樹,每個節點處按照節點不純度最小原則選取特征進行充分生長,不進行剪枝操作;步驟(4-4).調用RandomForestClassifier函數建模并訓練;步驟(4-5).對模型權重參數進行對數線性回歸檢驗;步驟(4-6).若檢驗通過且模型符合正態分布,則認為模型符合條件;步驟(4-7).根據生成的決策樹分類器對預測集進行預測,對每棵樹的預測結果求均值即為最終預測結果;步驟(4-8).繪制房價走勢圖;步驟(4-9).設定區間,預測該區間內房價的走勢;
步驟5.對數線性回歸測試;
步驟6.模型訓練與分析評估。
2.根據權利要求1所述的基于對數線性回歸和隨機森林的房價走勢分析方法,其特征在于:在步驟1中,所述因素還包括物價水平、國內生產總值、國民收入水平、金融政策、稅收政策、土地、城市化率和各類保障性住房的投入使用,所述小區因素包括占地面積、綠化率、容積率和所在商圈,所述客戶因素包括小區在客戶中的口碑狀況。
3.根據權利要求1所述的基于對數線性回歸和隨機森林的房價走勢分析方法,其特征在于:在步驟5中,所述模型測試具體包括以下步驟:步驟(5-1).輸入測試集中的數據進行測試;步驟(5-2).設定預測區間;步驟(5-3).預測某樓盤在設定區間內房價的走勢;步驟(5-4).與真實走勢圖進行對比,求得得分值,若得分值若大于0.6,則認為擬合成功,符合該樓盤房價的走勢。
4.根據權利要求1所述的基于對數線性回歸和隨機森林的房價走勢分析方法,其特征在于:在步驟6中,所述分析具體包括以下步驟:步驟(6-1).根據隨機森林模型中不同變量的因素所對應的權重,找出高權重的因素;步驟(6-2).將高權重的因素總結統計,進行更深層次的分析;步驟(6-3).自動生成分析報告。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南通大學,未經南通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010277368.8/1.html,轉載請聲明來源鉆瓜專利網。





