[發明專利]POI推薦模型的構建方法及系統在審
| 申請號: | 201811454774.6 | 申請日: | 2018-11-30 |
| 公開(公告)號: | CN111259268A | 公開(公告)日: | 2020-06-09 |
| 發明(設計)人: | 王新珩;伊雷·內擇瑞安汗擇;陳濤;瑪德塞·伊克巴爾 | 申請(專利權)人: | 知谷(上海)網絡科技有限公司 |
| 主分類號: | G06F16/9537 | 分類號: | G06F16/9537 |
| 代理公司: | 北京商專永信知識產權代理事務所(普通合伙) 11400 | 代理人: | 方挺;黃謙 |
| 地址: | 200439 上海市寶山區逸仙*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | poi 推薦 模型 構建 方法 系統 | ||
1.一種POI推薦模型的構建方法,包括:
獲取多個用戶在社交網絡中的歷史簽到數據集,其中,所述歷史簽到數據集至少包括:簽到時間、簽到地址的信息;
根據所述歷史簽到數據集內的簽到時間、簽到地址的信息確定所述用戶的POI特征集合;
提取所述POI特征集合中的至少一個POI特征,確定多個子模型訓練集;
通過監督模型對所述多個子模型訓練集分別訓練對應的POI概率估計,根據自決策樹對所述POI概率估計迭代更新,當所述POI概率估計達到或超過預設閾值時,確定多個POI推薦子模型;
根據應用加法聚集所述多個POI推薦子模型,以構建POI推薦模型。
2.根據權利要求1所述的方法,其中,所述簽到地址的信息包括:簽到地址名稱、簽到地址類別、簽到地址坐標;
所述POI特征集合包括:
根據單個用戶在各簽到地址名稱以及簽到地址類別的簽到次數,確定所述單個用戶的POI偏好以及類別偏好;
根據所述多個用戶在各簽到地址名稱以及簽到地址類別的簽到次數,確定各簽到地址的POI流行度;
根據所述單個用戶在預設簽到時間內相鄰的簽到地址的信息,確定所述單個用戶的POI轉換偏好以及類別轉換偏好;
根據所述多個用戶在預設簽到時間內相鄰的簽到地址的信息,確定各簽到地址的POI轉換流行度以及類別轉換流行度,其中,所述預設簽到時間還包括:小時、星期,確定所述各簽到地址的POI時間感知流行度以及類型時間感知流行度;
根據所述簽到地址坐標,確定各簽到地址間的地理距離。
3.根據權利要求2所述的方法,其中,所述提取所述POI特征集合中的至少一個POI特征,確定多個子模型訓練集包括:
通過預先指定簇的數量閾值,根據各簽到地址的地址坐標對所述各簽到地址進行聚類;
根據各聚類類別內各簽到地址的簽到次數確定各聚類類別的多個POI特征,從而確定多個子模型訓練集。
4.根據權利要求1所述的方法,其中,所述歷史簽到數據集包括訓練數據集以及驗證數據集,其中,所述訓練數據集用于確定用戶的POI特征集合。
5.根據權利要求4所述的方法,其中,在根據所述訓練數據集確定的用戶的POI特征集合之后,所述方法還包括:
根據所述POI特征集合確定多個POI推薦子模型;
通過驗證數據集對所述多個POI推薦子模型進行校驗,確定所述多個POI推薦子模型中的部分有效POI推薦子模型;
根據所述部分有效POI推薦子模型修剪所述多個POI推薦子模型,以減少過度擬合。
6.一種POI推薦模型的構建系統,包括:
歷史簽到數據集獲取程序模塊,用于獲取多個用戶在社交網絡中的歷史簽到數據集,其中,所述歷史簽到數據集至少包括:簽到時間、簽到地址的信息;
POI特征集合確定程序模塊,用于根據所述歷史簽到數據集內的簽到時間、簽到地址的信息確定所述用戶的POI特征集合;
子模型訓練集確定程序模塊,用于提取所述POI特征集合中的至少一個POI特征,確定多個子模型訓練集;
POI推薦子模型確定程序模塊,用于通過監督模型對所述多個子模型訓練集分別訓練對應的POI概率估計,根據自決策樹對所述POI概率估計迭代更新,當所述POI概率估計達到或超過預設閾值時,確定多個POI推薦子模型;
POI推薦模型確定程序模塊,用于根據應用加法聚集所述多個POI推薦子模型,以構建POI推薦模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于知谷(上海)網絡科技有限公司,未經知谷(上海)網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811454774.6/1.html,轉載請聲明來源鉆瓜專利網。





