[發(fā)明專利]旅客需求推薦方法有效
| 申請?zhí)枺?/td> | 201410175627.0 | 申請日: | 2014-06-26 |
| 公開(公告)號: | CN104021483B | 公開(公告)日: | 2017-08-25 |
| 發(fā)明(設計)人: | 陳思恩;馮望煙 | 申請(專利權)人: | 陳思恩 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06Q50/14;G06F17/30 |
| 代理公司: | 廣州市紅荔專利代理有限公司44214 | 代理人: | 張文 |
| 地址: | 361009 福建省廈門市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 旅客 需求 推薦 方法 | ||
1.旅客需求推薦方法,其特征在于,包括以下步驟:
步驟1,收集常規(guī)結構化數據,包括客戶信息,歷史交易數據,等級信息;
步驟2,通過JS嵌碼的方式收集的非結構化數據包括用戶在網站的在線行為,用JS標記收集到的非結構數據包括點擊、瀏覽區(qū)域、停留時間及Ajax,JS嵌碼收集用戶在線行為數據的過程如下:
根據定義的事件,嵌入JS代碼到網頁;
用戶訪問網頁時,將同時并發(fā)執(zhí)行嵌套在頁面中的JS標記代碼;
JS代碼通過事件或時間觸發(fā),將需要獲取的用戶行為信息以avro的方式發(fā)送到特定端口;
Flume監(jiān)聽端口,當監(jiān)聽到端口有數據輸入時,將用戶行為數據sink到HDFS中;
步驟3,將收集到的數據統一存放到分布式文件系統HDFS;
步驟4,在Mahout框架上選擇推薦模型,并利用收集到的數據訓練推薦模型;
步驟5,利用Mahout框架采用訓練好的模型基于歷史數據做離線推薦,并將推薦結果存儲到HDFS,當數據增長量超過一定閥值時,更新訓練模型以及離線推薦結果;
步驟6,當用戶登錄網站,為用戶提供離線推薦;
步驟7,瀏覽網站的過程中觸發(fā)事件,為用戶提供基于Storm的在線推薦,所述在線推薦具體通過以下方法實現:
用戶瀏覽網站,觸發(fā)推薦事件;
應用Kafka框架根據觸發(fā)事件,推送數據到storm集群;
推送數據包括觸發(fā)事件的行為數據以及推薦所需的部分歷史數據,行為數據為事件認定的關鍵詞,部分歷史數據為與關鍵詞和用戶相關的歷史數據;
應用storm集群啟動實時推薦引擎,應用離線推薦過程中訓練好的模型為用戶進行實時推薦,并將推薦結果以CSV的形式存放到HDFS推薦文件夾recommendation在線部分online之中;
前臺調用Service API,獲取推薦結果并展示;
步驟6中的在線推薦和步驟7中的離線推薦使用同一個推薦模型,所述推薦模型的訓練過程如下:
根據數據量的規(guī)模以及推薦性能要求,選擇合適的推薦模型;
對數據進行數據預處理;
訓練模型,模型訓練好之后,將模型關鍵參數放入到CSV文件,并存儲到HDFS模型文件夾model之中。
2.如權利要求1所述的旅客需求推薦方法,其特征在于:步驟3所述的HDFS文件系統,包括基于HDFS文件系統的數據庫Hbase和Hive。
3.如權利要求1所述的旅客需求推薦方法,其特征在于:步驟4中所述模型不僅包括聚類,分類,預測,協同過濾常用模型,還包括自行開發(fā)定制新的模型。
4.如權利要求1所述的旅客需求推薦方法,其特征在于:步驟4和5所述的模型訓練和推薦均采用分布式的實現。
5.如權利要求1所述的旅客需求推薦方法,其特征在于:步驟7中所述的事件采用定制的方式,定制方法視具體應用環(huán)境而定。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于陳思恩,未經陳思恩許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410175627.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:新型折疊注射器
- 下一篇:多向可調控體外復位髂腰墊





