[發(fā)明專利]用于預判問題的方法和系統(tǒng)在審
| 申請?zhí)枺?/td> | 201710164723.9 | 申請日: | 2017-03-20 |
| 公開(公告)號: | CN108628882A | 公開(公告)日: | 2018-10-09 |
| 發(fā)明(設計)人: | 楊俊 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 張一軍;姜勁 |
| 地址: | 100195 北京市海淀區(qū)杏石口路6*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 預判 特征向量 向量 數值形式 訓練模型 用戶特征 推送 轉換 | ||
1.一種用于預判問題的方法,其特征在于,包括:
步驟一,將用戶特征轉換為數值形式的特征向量;
步驟二,采用訓練模型,對所述特征向量進行訓練,以獲得詞典向量;以及
步驟三,向用戶推送與所述詞典向量相對應的一個或多個問題。
2.根據權利要求1所述的方法,其特征在于,將用戶特征轉換為數值形式的特征向量還包括:通過特征分類、特征清洗、特征組合以及特征選擇,將用戶特征轉換為數值形式的特征向量;其中所述特征分類包括根據屬性對用戶特征進行分類,所述特征清洗包括對用戶特征的各個維度進行歸一化處理,所述特征組合包括通過決策樹對用戶特征加以組合,所述特征選擇包括通過計算用戶特征的信息增益,選擇排名靠前的用戶特征。
3.根據權利要求1所述的方法,其特征在于,根據屬性將所述用戶特征分類為:
離線特征和實時特征,其中離線特征包括統(tǒng)計特征和建模特征;以及
連續(xù)型特征和枚舉型特征。
4.根據權利要求1所述的方法,其特征在于,所述訓練模型包括編碼模型、解碼模型以及注意力模型。
5.根據權利要求1所述的方法,其特征在于,所述方法還包括:
如果用戶沒有點擊向其推送的所述一個或多個問題,則收集用戶的進一步的特征,并且通過所述步驟一、所述步驟二和所述步驟三繼續(xù)進行問題的預判和推送。
6.一種用于預判問題的系統(tǒng),其特征在于,包括:
特征工程模塊,用于將用戶特征轉換為數值形式的特征向量;
模型訓練模塊,用于采用訓練模型,對所述特征向量進行訓練,以獲得詞典向量;以及
線上預測模塊,用于向用戶推送與所述詞典向量相對應的一個或多個問題。
7.根據權利要求6所述的系統(tǒng),其特征在于,所述特征工程模塊還用于:
通過特征分類、特征清洗、特征組合以及特征選擇,將用戶特征轉換為數值形式的特征向量;其中所述特征分類包括根據屬性對用戶特征進行分類,所述特征清洗包括對用戶特征的各個維度進行歸一化處理,所述特征組合包括通過決策樹對用戶特征加以組合,所述特征選擇包括通過計算用戶特征的信息增益,選擇排名靠前的用戶特征。
8.根據權利要求6所述的系統(tǒng),其特征在于,根據屬性將所述用戶特征分類為:
離線特征和實時特征,其中離線特征包括統(tǒng)計特征和建模特征;以及
連續(xù)型特征和枚舉型特征。
9.根據權利要求6所述的系統(tǒng),其特征在于,所述訓練模型包括編碼模型、解碼模型以及注意力模型。
10.根據權利要求6所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括:
增強學習模塊,用于如果用戶沒有點擊向其推送的所述一個或多個問題,則收集用戶的進一步的特征,并且通過所述特征工程模塊、所述模型訓練模塊和所述線上預測模塊繼續(xù)進行問題的預判和推送。
11.一種電子設備,其特征在于,包括:
至少一個處理器;以及,
與所述至少一個處理器通信連接的存儲器;其中,
所述存儲器存儲有可被所述一個處理器執(zhí)行的指令,所述指令被所述至少一個處理器執(zhí)行,以使所述至少一個處理器能夠執(zhí)行權利要求1-5中任一項所述的方法。
12.一種非暫態(tài)計算機可讀存儲介質,其特征在于,所述非暫態(tài)計算機可讀存儲介質存儲計算機指令,所述計算機指令用于使所述計算機執(zhí)行權利要求1-5中任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司,未經北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710164723.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:數據同步方法和裝置
- 下一篇:一種數據處理方法、裝置及電子設備





