[發明專利]預測長租公寓是否符合預期的方法、系統、設備及介質在審
| 申請號: | 202011394908.7 | 申請日: | 2020-12-03 |
| 公開(公告)號: | CN112465238A | 公開(公告)日: | 2021-03-09 |
| 發明(設計)人: | 張書博 | 申請(專利權)人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06K9/62;G06Q50/16;G06N3/04;G06N3/08 |
| 代理公司: | 北京連和連知識產權代理有限公司 11278 | 代理人: | 劉小峰;陳黎明 |
| 地址: | 215100 江蘇省蘇州市吳*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 預測 公寓 是否 符合 預期 方法 系統 設備 介質 | ||
本發明公開了一種預測長租公寓是否符合預期的方法、系統、設備和存儲介質,方法包括:獲取長租公寓的租賃數據,將單位時間內的第一比例的數據作為驗證集,將單位時間內的其他數據劃分為訓練集和測試集;使用訓練集生成基本隨機森林模型,使用測試集計算基本隨機森林模型中每個決策樹的AUC值;保留預設數量個AUC值最高的決策樹,并對保留的決策樹進行聚類以得到隨機森林模型,并使用驗證集對隨機森林模型進行驗證以得到最終的隨機森林模型;以及獲取用戶輸入的目標長租公寓數據,并利用最終的隨機森林模型對目標長租公寓數據進行處理以預測目標長租公寓是否符合預期。本發明通過使用隨機森林算法,預測目標長租公寓是否符合要求,減少了租房的風險。
技術領域
本發明涉及數據分析領域,更具體地,特別是指一種預測長租公寓是否符合預期的方法、系統、計算機設備及可讀介質。
背景技術
目前越來越多的人進入大城市尋找工作機會,隨之而來的就是這些人的住宿問題,當代年輕人相比過去更加追求生活舒適度與幸福感,于是單人的長租公寓成為了年輕人的首選。租賃中介公司等,也越來越多。為了能夠省心,人們肯定希望能夠選擇到一個適合自己長期居住的公寓,這樣就可以省去搬家的麻煩。但是目前在房屋租賃領域還有很多規則并不完善,有可能會出現中介攜款跑路的情況,增加了租房的風險。
目前的房屋租賃平臺,大多只是一種類似于市場的平臺,出租房按照平臺標準掛出房屋信息,承租方根據信息進行選擇和咨詢,信息并不公開透明,也不保證準確真實,使得承租方不容易做出選擇,且可能承擔更多的風險。
發明內容
有鑒于此,本發明實施例的目的在于提出一種預測長租公寓是否符合預期的方法、系統、計算機設備及計算機可讀存儲介質,通過使用隨機森林算法,只保留AUC值高的決策樹,并對保留的決策樹進行聚類,提高了預測的準確性。基于本方法,可以減少用戶尋找合適公寓的時間并降低中介與房東出現信用問題的風險,便于維護公寓房東、中介與租客三者的利益關系,提高公寓租賃平臺的競爭力,可為人工智能平臺提供訓練數據與推理功能。
基于上述目的,本發明實施例的一方面提供了一種預測長租公寓是否符合預期的方法,包括如下步驟:獲取長租公寓的租賃數據,并將單位時間內的第一比例的數據作為驗證集,將單位時間內的其他數據劃分為訓練集和測試集;使用所述訓練集生成基本隨機森林模型,使用所述測試集計算所述基本隨機森林模型中每個決策樹的AUC值;保留預設數量個AUC值最高的決策樹,并對保留的決策樹進行聚類以得到隨機森林模型,并使用所述驗證集對所述隨機森林模型進行驗證以得到最終的隨機森林模型;以及獲取用戶輸入的目標長租公寓數據,并利用所述最終的隨機森林模型對所述目標長租公寓數據進行處理以預測所述目標長租公寓是否符合預期。
在一些實施方式中,所述對保留的決策樹進行聚類以得到隨機森林模型包括:計算保留的決策樹中每兩個決策樹之間的相似度,并判斷所述相似度是否超過閾值;以及響應于兩個決策樹之間的相似度超過閾值,將所述兩個決策樹劃分成一類。
在一些實施方式中,所述對保留的決策樹進行聚類以得到隨機森林模型,并使用所述驗證集對所述隨機森林模型進行驗證以得到最終的隨機森林模型包括:計算AUC值最高的第一決策樹與其他每個決策樹之間的相似度,并將相似度高于所述閾值的決策樹均劃分到所述第一決策樹所屬的一類中,并使用所述驗證集判斷當前隨機森林模型的準確率是否符合要求;以及響應于當前隨機森林模型的準確率不符合要求,計算未分類的決策樹中AUC值最高的第二決策樹與其他未分類的決策樹之間的相似度,并將相似度高于所述閾值的決策樹均劃分到所述第二決策樹所屬的一類中,重復本步驟直到當前隨機森林模型的準確率符合要求。
在一些實施方式中,所述將單位時間內的其他數據劃分為訓練集和測試集包括:將所述其他數據通過分層采樣劃分成十個大小相同的互斥子集,將其中的九個子集的并集作為訓練集,并將余下的子集作為測試集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州浪潮智能科技有限公司,未經蘇州浪潮智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011394908.7/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





