[發明專利]旅客需求推薦方法有效
| 申請號: | 201410175627.0 | 申請日: | 2014-06-26 |
| 公開(公告)號: | CN104021483B | 公開(公告)日: | 2017-08-25 |
| 發明(設計)人: | 陳思恩;馮望煙 | 申請(專利權)人: | 陳思恩 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06Q50/14;G06F17/30 |
| 代理公司: | 廣州市紅荔專利代理有限公司44214 | 代理人: | 張文 |
| 地址: | 361009 福建省廈門市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 旅客 需求 推薦 方法 | ||
技術領域
本發明涉及民航旅游業的個性化推薦系統構建方法,尤其涉及一種旅客需求推薦方法。
背景技術
在過去的幾十年里,隨著網絡基礎設施的普及與改進以及移動互聯網相關服務及應用的推廣,信息技術的發展讓我們進入一個信息爆炸的時代?,F如今,無論您身處哪個行業,信息爆炸都是一個不可回避的話題。從航空航天到電子商務,從銀行業到醫療行業,雖然行業不同,但都面臨著同樣的問題,那就是呈爆炸式增長的數據量。民航旅游業也不例外。業界將這種爆炸式增長的數據稱為大數據,大數據雖然價值密度低,但是總體價值大,因此大數據既是機遇又是挑戰。大數據帶來的機遇之一,就是通過大數據分析用戶行為習慣,據此為用戶提供個性代的推薦。
但目前,航空旅游業的個性化推薦存在以下問題:
1.數據收集問題。用戶在航空旅游的網站上留下了大量的數據,這些數據不僅包括交易等結構化的數據,還包括用戶行為等非結構化數據。傳統推薦因為受技術限制,只關注結構化數據的應用,而忽略了非結構化數據的應用。
2.推薦算法可擴展性問題。隨著用戶和物品數量的大量增加,算法的推薦性能和速度都大幅降低,如此一來,時間和空間都超出可控范圍,導致其執行效率變得非常低下,嚴重影響推薦效果和用戶滿意度。
3.互聯網環境下,社交網絡發達,信息獲取途徑多,用戶認知和接受能力的周期變短,使得用戶偏好波動變大。比方說某用戶在兩周以前特別喜歡籃球,他的旅游計劃是本周去美國看一場NBA比賽,但在上周他通過社交網絡加入到一個足球的社交群體,通過與群體的交流認知,他覺得足球更有魅力,由此他就本周旅行計劃改為去曼徹斯特老特拉福球場看一場足球比賽。
發明內容
為了解決上述問題,本發明提供一種旅客需求推薦方法,本發明的技術方案如下。
旅客需求推薦方法,包括以下步驟:
步驟1,收集客戶信息,歷史交易數據,等級信息等常規結構化數據;
步驟2,通過JS嵌碼的方式收集用戶在網站的在線行為等非結構化數據;
步驟3,將收集到的數據統一存放到分布式文件系統HDFS;
步驟4,在Mahout框架上選擇推薦模型,并利用收集到的數據訓練推薦模型;
步驟5,利用Mahout框架采用訓練好的模型基于歷史數據做離線推薦,并將推薦結果存儲到HDFS;
步驟6,當用戶登錄網站,為用戶提供離線推薦;
步驟7,瀏覽網站的過程中觸發事件,為用戶提供基于Storm的在線推薦。
其中,推薦模型的訓練過程如下:
步驟1,根據數據量的規模以及推薦性能要求,選擇合適的推薦模型;
步驟2,對數據進行數據預處理;
步驟3,訓練模型,模型訓練好之后,將模型關鍵參數放入到CSV文件,并存儲到HDFS模型文件夾model之中。
其中,在線推薦和離線推薦使用同一個推薦模型,模型基于離線的歷史數據訓練,其中歷史數據包括結構化的交易數據,也包括非結構化的在線行為數據。
其中,當數據增長量超過一定閥值時,更新離線推薦和訓練模型,閥值可自行設定,離線推薦的閥值初定為5%,訓練模型的更新閥值初定為15%。
本發明的有益效果是,
1. 本發明擴大了數據的應用范圍,不僅利用了用戶交易等結構化數據,還利用了用戶行為等非結構化數據,通過擴大數據應用范圍,提升推薦精度。
2.本發明采用在線推薦和離線推薦兩種推薦方式,不僅使得推薦的穩定性更高,而且可再次提升推薦精度。
3.在線推薦和離線推薦均采用分布式的計算框架實現,通過分布式框架提升計算能力,可根據數據規模在計算能力上做水平擴展,解決算法的可擴展性問題。
4.JS頁面標記獲取用戶行為數據靈活性和可控性都較好,不僅可定制收集各用種戶行為,而且獲取信息較為完整。
以下將將結合附圖以實施例的方式對本發明做進一步闡述。
附圖說明
圖 1是本發明實施例的技術架構圖;
圖 2是本發明實施例JS標記獲取用戶行為信息;
圖 3本發明實施例的用戶行為示意圖;
圖 4本發明實施例的推薦效果示意圖。
具體實施方式
為了使本發明的目的、技術方案及優點更加清楚明白,以下結合附圖及實施例,對本發明進行進一步詳細說明。
如圖1所示,本發明實施推薦方法包括離線推薦和在線推薦兩部分,其中離線推薦的執行過程如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于陳思恩,未經陳思恩許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410175627.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:新型折疊注射器
- 下一篇:多向可調控體外復位髂腰墊





