[發明專利]基于文檔的關鍵詞推送方法及裝置有效
| 申請號: | 201710137604.4 | 申請日: | 2017-03-09 |
| 公開(公告)號: | CN106919702B | 公開(公告)日: | 2020-02-11 |
| 發明(設計)人: | 王立寧;陳勁 | 申請(專利權)人: | 北京時間股份有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/33;G06N3/04;G06N3/08 |
| 代理公司: | 11276 北京市浩天知識產權代理事務所(普通合伙) | 代理人: | 宋菲;劉蘭蘭 |
| 地址: | 100089 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 文檔 關鍵詞 推送 方法 裝置 | ||
1.一種基于文檔的關鍵詞推送方法,包括:
每當獲取到文檔時,將獲取到的文檔所對應的文檔內容輸入預設的神經網絡模型;
獲取所述神經網絡模型的輸出結果,根據所述輸出結果確定所述文檔的關鍵詞,并對所述關鍵詞進行推送;
獲取用戶終端針對推送的所述關鍵詞觸發的反饋結果,根據所述反饋結果對所述預設的神經網絡模型進行增強學習;
根據所述增強學習的學習結果對所述預設的神經網絡模型進行調整;
其中,對關鍵詞進行推送時,為各個關鍵詞設置多個不同的點擊操作入口;在根據用戶終端針對推送的關鍵詞觸發的反饋結果對預設的神經網絡模型進行增強學習時,進一步將查詢到的用戶日志文件中包含的與關鍵詞對應的點擊事件細分為多種類型的點擊操作事件,預先為每種類型的點擊操作事件設置不同的分析優先級,并根據不同類型的點擊操作事件的分析優先級設置對應的反饋結果的結果分值,該結果分值用于確定對應的樣本的樣本權重;其中,所述點擊操作事件包括:評分點擊操作事件、瀏覽點擊操作事件和搜索點擊操作事件。
2.根據權利要求1所述的方法,其中,所述將獲取到的文檔所對應的文檔內容輸入預設的神經網絡模型的步驟之前,進一步包括:
對所述獲取到的文檔進行預處理,將預處理結果作為所述文檔對應的文檔內容;其中,所述預處理包括以下中的至少一個:分詞處理、以及詞向量轉換處理。
3.根據權利要求1所述的方法,其中,所述根據所述輸出結果確定所述文檔的關鍵詞的步驟具體包括:根據預設的篩選策略對所述輸出結果進行篩選,將篩選結果確定為所述文檔的關鍵詞;
其中,所述篩選策略包括以下中的至少一個:根據詞性進行篩選的策略;以及,根據詞頻進行篩選的策略。
4.根據權利要求1所述的方法,其中,所述對所述關鍵詞進行推送的步驟之后進一步包括:當監測到用戶終端針對所述關鍵詞觸發的點擊事件時,將所述點擊事件記錄到用戶日志文件中;
則所述獲取用戶終端針對推送的所述關鍵詞觸發的反饋結果的步驟具體包括:
查詢所述用戶日志文件中是否包含與所述關鍵詞對應的點擊事件;
當查詢結果為否時,確定所述用戶終端針對推送的所述關鍵詞觸發的反饋結果為第一類反饋結果;其中,所述第一類反饋結果對應的關鍵詞用于作為負樣本提供給所述神經網絡模型進行增強學習;
當查詢結果為是時,確定所述用戶終端針對推送的所述關鍵詞觸發的反饋結果為第二類反饋結果;其中,所述第二類反饋結果對應的關鍵詞用于作為正樣本提供給所述神經網絡模型進行增強學習。
5.根據權利要求4所述的方法,其中,當查詢結果為是時,進一步包括:確定所述用戶日志文件中包含的與所述關鍵詞對應的點擊事件的次數,根據次數確定第二類反饋結果對應的結果分值;其中,所述結果分值用于確定對應的負樣本的樣本權重。
6.根據權利要求4或5所述的方法,其中,所述獲取用戶終端針對推送的所述關鍵詞觸發的反饋結果的步驟具體包括:
每隔預設的時間間隔獲取一次用戶終端針對推送的所述關鍵詞觸發的反饋結果;和/或,
每當所述用戶日志文件中錄入點擊事件時觸發與所述點擊事件對應的通知消息,通過訂閱所述通知消息獲取用戶終端針對推送的所述關鍵詞觸發的反饋結果。
7.根據權利要求1-5任一所述的方法,其中,所述神經網絡模型包括以下中的至少一個:卷積神經網絡、以及循環神經網絡;
其中,所述卷積神經網絡包括:至少一個卷積核,用于對所述文檔內容進行特征提取;
所述循環神經網絡包括:長短期記憶網絡,其中,所述長短期記憶網絡中的當前時間點的輸入數據為上一個時間點的輸出數據。
8.根據權利要求1-5任一所述的方法,其中,所述增強學習的算法包括反向傳播算法。
9.根據權利要求1-5任一所述的方法,其中,所述方法執行之前,進一步包括步驟:從預設的分布式消息隊列中獲取文檔。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京時間股份有限公司,未經北京時間股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710137604.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種分布數據的處理方法及裝置
- 下一篇:電影信息搜索方法及裝置





