[發(fā)明專利]一種基于爬蟲技術(shù)的旅游推薦方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201811434117.5 | 申請日: | 2018-11-28 |
| 公開(公告)號: | CN109284443A | 公開(公告)日: | 2019-01-29 |
| 發(fā)明(設(shè)計)人: | 茍佳潔;石珮生;魏文敏 | 申請(專利權(quán))人: | 四川亨通網(wǎng)智科技有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06Q50/12 |
| 代理公司: | 成都立新致創(chuàng)知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 51277 | 代理人: | 譚德兵 |
| 地址: | 610000 四川省成都市天府*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 反饋信息 爬蟲技術(shù) 旅游 冷啟動 建模 景點 畫像 地理位置因素 個性化推薦 人口統(tǒng)計 檢查數(shù)據(jù) 旅游線路 評分結(jié)果 氣候因素 數(shù)據(jù)分析 數(shù)據(jù)獲得 數(shù)據(jù)清洗 推薦系統(tǒng) 用戶評論 挖掘 樹算法 精細 愛好 分類 回歸 人群 | ||
1.一種基于爬蟲技術(shù)的旅游推薦方法,其特征在于包括以下步驟:
爬取數(shù)據(jù),爬取旅游數(shù)據(jù)獲得用戶評論信息;
數(shù)據(jù)清洗,檢查數(shù)據(jù)有無空值,格式錯誤的值;
挖掘信息,根據(jù)爬取的旅游數(shù)據(jù)分析景點的季節(jié)特性、對景點進行分類、挖掘景點的適宜人群、用戶旅游愛好、旅游線路;
多策略的冷啟動建模,基于氣候因素推薦、基于地理位置因素推薦、基于人口統(tǒng)計推薦;
用戶畫像建模,通過冷啟動過程后,收到大量的反饋信息,根據(jù)梯度提升樹算法利用這些反饋信息完成用戶的特征工程,建立精細的用戶畫像模型;
最后利用邏輯斯蒂回歸進行個性化推薦,得到推薦系統(tǒng)的評分結(jié)果。
2.根據(jù)權(quán)利要求1所述的一種基于爬蟲技術(shù)的旅游推薦方法,其特征在于,所述用戶評論信息包括用戶評論文本、用戶評論時間、用戶名字、用戶評論點贊數(shù)。
3.根據(jù)權(quán)利要求2所述的一種基于爬蟲技術(shù)的旅游推薦方法,其特征在于,所述分析景點的季節(jié)特性是指根據(jù)一年之中該景點的人流量進行統(tǒng)計,將人流量最高的前三個月作為該景點的旅游旺季。
4.根據(jù)權(quán)利要求3所述的一種基于爬蟲技術(shù)的旅游推薦方法,其特征在于,所述旅游線路的分析方法為:
從爬取的數(shù)據(jù)中提取在一定時間內(nèi)對多個景點進行評論的用戶,并根據(jù)這些用戶對不同景點評價的時間線生成A類旅游線路;
或,根據(jù)景點的季節(jié)特性結(jié)合地理位置生成B類旅游路線;
或,根據(jù)景點分類結(jié)合地理位置生成C類旅游路線;
或,根據(jù)景點的適宜人群結(jié)合地理位置生成D類旅游路線;
或,根據(jù)用戶愛好對某一類的旅游景點結(jié)合地理位置生成E類旅游路線。
5.根據(jù)權(quán)利要求1所述的一種基于爬蟲技術(shù)的旅游推薦方法,其特征在于,所述基于氣候因素推薦是指根據(jù)當前時間以及氣候推薦適宜的景點娛樂項目;
所述基于地理位置因素推薦是指根據(jù)目標用戶地址,推薦一些其他與該IP地址不同地貌或人文景觀的風(fēng)景;
所述基于人口統(tǒng)計推薦是指根據(jù)網(wǎng)民的年齡層次統(tǒng)計數(shù)據(jù)得到占比重最大的年齡段,向目標用戶推薦占比重最大的年齡段最適宜景點。
6.一種實現(xiàn)權(quán)利要求1-5中任一項所述的一種基于爬蟲技術(shù)的旅游推薦系統(tǒng),其特征在于,該系統(tǒng)包括:
數(shù)據(jù)爬取模塊,利用數(shù)據(jù)爬蟲爬取各網(wǎng)站的旅游評論信息,包括該評論用戶的個人信息、評論內(nèi)容、評論時間;
數(shù)據(jù)分析模塊,用于檢查數(shù)據(jù)有無空值,格式錯誤的值,然后根據(jù)爬取的數(shù)據(jù)挖掘出景點的季節(jié)特性、對景點進行分類、挖掘景點的適宜人群、用戶旅游愛好、旅游線路;
策略模塊,利用爬取的數(shù)據(jù)分析結(jié)果基于氣候因素、地理位置因素、人口統(tǒng)計進行推薦;
用戶畫像建模模塊,利用收到的反饋信息,根據(jù)梯度提升樹算法利用這些反饋信息完成用戶的特征工程,建立精細的用戶畫像模型;
輸出模塊,最后利用邏輯斯蒂回歸進行個性化推薦,得到推薦系統(tǒng)的評分結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于四川亨通網(wǎng)智科技有限公司,未經(jīng)四川亨通網(wǎng)智科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811434117.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種基于PetriNet的分布式行為模擬爬蟲技術(shù)
- 一種自動化垂直細分領(lǐng)域的爬蟲爬取方法及其管理系統(tǒng)
- 一種通過爬蟲狀態(tài)機管理爬蟲的方法及裝置
- 基于APP客戶端的爬蟲及爬取方法
- 使用爬蟲獲取外部數(shù)據(jù)的方法及裝置
- 網(wǎng)絡(luò)爬蟲系統(tǒng)的測試方法及裝置、存儲介質(zhì)、電子設(shè)備
- 一種爬蟲方法、裝置、系統(tǒng)、設(shè)備及可讀存儲介質(zhì)
- 網(wǎng)絡(luò)爬蟲方法、裝置、設(shè)備及介質(zhì)
- 一種基于爬蟲技術(shù)的多任務(wù)處理系統(tǒng)及方法
- 一種基于分布式的網(wǎng)絡(luò)自適應(yīng)分類爬蟲方法





