[發明專利]基于神經網絡的搜索優化方法、裝置以及搜索引擎有效
| 申請號: | 201611071564.X | 申請日: | 2016-11-28 |
| 公開(公告)號: | CN106776869B | 公開(公告)日: | 2020-04-07 |
| 發明(設計)人: | 王昕煜;姜迪;石磊;李辰;廖夢;何徑舟 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/903 | 分類號: | G06F16/903;G06N3/04 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 神經網絡 搜索 優化 方法 裝置 以及 搜索引擎 | ||
1.一種基于神經網絡的搜索優化方法,其特征在于,包括以下步驟:
獲取用戶輸入的當前搜索詞以及前置搜索詞;
根據所述當前搜索詞獲取多個搜索結果;
基于多層神經網絡MLP,根據所述當前搜索詞、所述前置搜索詞和所述多個搜索結果生成目標詞向量表示;其中,所述基于多層神經網絡MLP,根據所述當前搜索詞、所述前置搜索詞和所述多個搜索結果生成目標詞向量表示,包括:
獲取所述當前搜索詞與所述前置搜索詞之間的分詞交集集合、第一分詞差集集合、第二分詞差集集合以及分詞并集集合,其中,所述第一分詞差集集合用于指示存在于所述當前搜索詞而未存在于所述前置搜索詞的分詞集合,所述第二分詞差集集合用于指示存在于所述前置搜索詞而未存在于所述當前搜索詞的分詞集合;
獲取所述多個搜索結果的分詞集合和搜索標識集合,其中,所述搜索標識集合用于指示所述多個搜索結果是出現在所述前置搜索詞的點擊集合、非點擊集合還是未展現集合;
基于所述多層神經網絡MLP,根據所述當前搜索詞、前置搜索詞、分詞交集集合、第一分詞差集集合、第二分詞差集集合、分詞并集集合、以及所述多個搜索結果的分詞集合和搜索標識集合,生成所述目標詞向量表示;
基于深度神經網絡DNN技術的語義模型對所述目標詞向量表示進行預測,得到與所述當前搜索詞對應的多個優化搜索結果。
2.如權利要求1所述的方法,其特征在于,所述多層神經網絡MLP包括連接層、非線性變換層、全連接層和MLP層;其中,所述基于所述多層神經網絡MLP,根據所述當前搜索詞、前置搜索詞、分詞交集集合、第一分詞差集集合、第二分詞差集集合、分詞并集集合、以及所述多個搜索結果的分詞集合和搜索標識集合,生成所述目標詞向量表示,包括:
將所述當前搜索詞、前置搜索詞、分詞交集集合、第一分詞差集集合、第二分詞差集集合、分詞并集集合通過所述連接層連接成所述當前搜索詞的詞向量;
通過所述非線性變換層對所述當前搜索詞的詞向量進行非線性變換,并通過所述全連接層對非線性變換后的所述當前搜索詞的詞向量進行全連接以生成所述當前搜索詞的詞向量表示;
將所述多個搜索結果的分詞集合和搜索標識集合通過所述連接層連接成所述多個搜索結果的詞向量;
通過所述非線性變換層對所述多個搜索結果的詞向量進行非線性變換,并通過所述全連接層對非線性變換后的所述多個搜索結果的詞向量進行全連接以生成所述多個搜索結果的詞向量表示;
根據所述當前搜索詞的詞向量表示和所述多個搜索結果的詞向量表示,通過所述MLP層生成所述目標詞向量表示。
3.如權利要求1至2中任一項所述的方法,其特征在于,還包括:
確定所述當前搜索詞與所述前置搜索詞之間的關系類型;
其中,所述基于多層神經網絡MLP,根據所述當前搜索詞、所述前置搜索詞和所述多個搜索結果生成目標詞向量表示,包括:
基于所述多層神經網絡MLP,根據所述關系類型、所述當前搜索詞、所述前置搜索詞和所述多個搜索結果生成所述目標詞向量表示。
4.如權利要求1至2中任一項所述的方法,其特征在于,在所述得到與所述當前搜索詞對應的多個優化搜索結果之后,所述方法還包括:
獲取所述當前搜索詞的上下文信息;
根據所述上下文信息對所述多個優化搜索結果進行重新排序;
將重新排序后的多個優化搜索結果展現在搜索結果頁面中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611071564.X/1.html,轉載請聲明來源鉆瓜專利網。





