[發明專利]OTA的民宿客棧挖掘方法在審
| 申請號: | 201710202511.5 | 申請日: | 2017-03-30 |
| 公開(公告)號: | CN106875134A | 公開(公告)日: | 2017-06-20 |
| 發明(設計)人: | 李翔;嚴捷冰;李發科;鞠濤偉 | 申請(專利權)人: | 攜程計算機技術(上海)有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06Q50/12;G06F17/30;G06K9/62;G06K9/66;G06N3/08 |
| 代理公司: | 上海弼興律師事務所31283 | 代理人: | 薛琦,張冉 |
| 地址: | 200335 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | ota 客棧 挖掘 方法 | ||
1.一種OTA的民宿客棧挖掘方法,其特征在于,包括以下步驟:
S1、建立基于酒店文本信息的民宿客棧粗粒度挖掘模型;
S2、建立基于酒店圖像信息的民宿客棧細粒度挖掘模型;
S3、結合所述粗粒度挖掘模型和所述細粒度挖掘模型對OTA酒店中的民宿客棧進行挖掘。
2.如權利要求1所述的OTA的民宿客棧挖掘方法,其特征在于,步驟S1包括:
S11、建立一系列關鍵字集合,包括:
包含集團酒店關鍵字的第一集合;包含傳統酒店的酒店名稱關鍵字的第二集合;包含傳統酒店的房型名稱關鍵字的第三集合;包含民宿客棧的酒店名稱關鍵字的第四集合;包含古鎮、景區和商業區關鍵字的第五集合;包含民宿客棧的用戶點評關鍵字的第六集合;
S12、對于待挖掘的OTA酒店,若屬于步驟S11建立的第一集合中的集團酒店關鍵字對應的集團酒店,或酒店名稱中出現步驟S11建立的第二集合中的關鍵字,或房型名稱中出現步驟S11建立的第三集合中的關鍵字,則所述待挖掘的OTA酒店被判為屬于傳統酒店;若酒店名稱中出現步驟S11建立的第四集合中的關鍵字,則所述待挖掘的OTA酒店被判為屬于民宿客棧;若不滿足上述兩種情況,則執行S13;
S13、利用步驟S11建立的第五集合,結合所述待挖掘的OTA酒店的位置信息進行進一步挖掘,若酒店位于所述第五集合中的古鎮和商業區關鍵字對應的古鎮和商業區,或位于所述第五集合中的景區關鍵字對應的景區附近第一距離閾值范圍內,則所述待挖掘的OTA酒店被判為待定酒店,若不滿足,則執行S14;
S14、將步驟S11建立的第六集合中的關鍵字在所述待挖掘的OTA酒店的用戶點評中進行搜索,若包括所述關鍵字的用戶點評數量大于等于第一閾值并且所述用戶點評數量占所有用戶點評的比例大于等于第二閾值,則所述酒店被判為待定酒店,否則被判為傳統酒店。
3.如權利要求1所述的OTA的民宿客棧挖掘方法,其特征在于,步驟S2包括:
S21、收集多個圖像,并生成第一圖像訓練集;
S22、利用所述第一圖像訓練集訓練基于深度神經網絡的圖像特征提取模型;
S23、收集傳統酒店和民宿客棧兩個類別的外觀圖像,生成第二圖像訓練集;
S24、利用所述第二圖像訓練集訓練基于外觀圖像的傳統酒店和民宿客棧的二分類模型,通過判斷酒店外觀圖像是否屬于民宿客棧,實現民宿客棧的細粒度挖掘。
4.如權利要求3所述的OTA的民宿客棧挖掘方法,其特征在于,步驟S22中所訓練的圖像特征提取模型使用的深度神經網絡為8層的卷積神經網絡。
5.如權利要求3所述的OTA的民宿客棧挖掘方法,其特征在于,步驟S22中所述的圖像特征提取模型,將待提取特征的圖像作為所述網絡的輸入,將所述待提取特征的圖像在所述網絡的特定層的輸出值作為特征表達。
6.如權利要求3所述的OTA的民宿客棧挖掘方法,其特征在于,步驟S24包括:
S241、將通過步驟S23生成的所述第二圖像訓練集中的所有圖像,利用步驟S22訓練得到的所述圖像特征提取模型進行特征提取,獲取相應的圖像特征表達;
S242、利用通過步驟S241提取到的所述第二圖像訓練集中的圖像對應的圖像特征表達,訓練一個集成學習分類器,輸入一張酒店的外觀圖像到所述集成學習分類器,則輸出圖像所屬類別,類別包括傳統酒店、民宿客棧。
7.如權利要求3所述的OTA的民宿客棧挖掘方法,其特征在于,步驟S3包括:
S31、對于一家OTA酒店,利用步驟S1建立的民宿客棧粗粒度挖掘模型進行第一次挖掘;
S32、對于一家OTA酒店,利用步驟S2建立的民宿客棧細粒度挖掘模型進行第二次挖掘;
S33、重復執行步驟S31和S32,對OTA的所有酒店完成民宿客棧的挖掘。
8.如權利要求7所述的OTA的民宿客棧挖掘方法,其特征在于,在步驟S31中,對于一家OTA酒店,若所述民宿客棧粗粒度挖掘模型將所述OTA酒店判為民宿客棧,則所述OTA酒店被認為是民宿客棧,若所述民宿客棧粗粒度挖掘模型將所述OTA酒店判為傳統酒店,則所述OTA酒店被認為是傳統酒店,若所述民宿客棧粗粒度挖掘模型將所述OTA酒店判為待定酒店,則執行步驟S32。
9.如權利要求8所述的OTA的民宿客棧挖掘方法,其特征在于,在步驟S32中,對于一家OTA酒店,將所述OTA酒店的所有外觀圖像依次輸入步驟S24訓練的基于外觀圖像的傳統酒店和民宿客棧的二分類模型中,綜合所述二分類模型對所有外觀圖像判定的類別進行最終挖掘,確定所述OTA酒店是否是民宿客棧。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于攜程計算機技術(上海)有限公司,未經攜程計算機技術(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710202511.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種網狀式公交系統的構建方法
- 下一篇:補貨方法及其裝置
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





