[發明專利]基于人工智能的搜索方法和裝置有效
| 申請號: | 201710700721.7 | 申請日: | 2017-08-16 |
| 公開(公告)號: | CN107463704B | 公開(公告)日: | 2021-05-07 |
| 發明(設計)人: | 周坤勝;馮仕堃;朱志凡;何徑舟 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/906 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 搜索 方法 裝置 | ||
1.一種基于人工智能的搜索方法,其特征在于,所述方法包括:
執行以下模型訓練步驟:對于第一搜索用信息集合中的每條第一搜索用信息,將所述第一搜索用信息所對應的推送信息集合中的推送信息進行兩兩組合得到多個推送信息對,基于所述第一搜索用信息、所述多個推送信息對和所述多個推送信息對中的推送信息當前的優先級對預設的機器學習模型進行訓練,其中,所述多個推送信息對中的每個推送信息對所包括的推送信息的優先級互不相同;利用經訓練的所述機器學習模型對預先存儲的測試樣本集合中的測試樣本進行預測操作得到預測結果,其中,所述測試樣本集合中的每個測試樣本包括第二搜索用信息和所述第二搜索用信息所對應的測試用信息對,所述測試用信息對中的各條測試用信息具有預設的互不相同的優先級;基于所述測試樣本集合中的每個測試樣本所包括的測試用信息對中的測試用信息的優先級,確定所述預測結果的錯誤率;若所述錯誤率低于閾值,則將當前經訓練后的所述機器學習模型作為評分模型;
若所述錯誤率不低于所述閾值,則基于所述預測結果中的錯誤結果,對所述第一搜索用信息集合中的第一搜索用信息所對應的推送信息集合中的推送信息的優先級進行調整,并繼續執行所述模型訓練步驟;
接收用戶輸入的搜索用信息;
基于所述搜索用信息,確定候選推送信息集合;
利用所述評分模型基于所述搜索用信息和所述候選推送信息集合,預測所述候選推送信息集合中的每條候選推送信息被點擊的概率;
按照被點擊的概率由大到小的順序,從所述候選推送信息集合中選取預置數目條候選推送信息組成推送信息序列,將所述推送信息序列推送至所述用戶的終端設備。
2.根據權利要求1所述的方法,其特征在于,所述基于所述搜索用信息,確定候選推送信息集合,包括:
確定預先存儲的歷史搜索用信息列表中是否存在與所述搜索用信息匹配的目標歷史搜索用信息,若是,則將所述目標歷史搜索用信息所對應的擬推送信息集合作為所述候選推送信息集合,其中,所述歷史搜索用信息列表中的每條歷史搜索用信息對應擬推送信息集合。
3.根據權利要求2所述的方法,其特征在于,所述基于所述搜索用信息,確定候選推送信息集合,包括:
若不存在所述目標歷史搜索用信息,則將所述搜索用信息發送至所連接的數據庫服務器,以使所述數據庫服務器返回所述候選推送信息集合。
4.根據權利要求1所述的方法,其特征在于,所述利用所述評分模型基于所述搜索用信息和所述候選推送信息集合,預測所述候選推送信息集合中的每條候選推送信息被點擊的概率,包括:
從所述搜索用信息中提取出關鍵詞生成第一關鍵詞向量;
從所述候選推送信息集合中的每條候選推送信息中提取出關鍵詞生成與所述候選推送信息對應的第二關鍵詞向量;
對于所生成的每個第二關鍵詞向量,將所述第一關鍵詞向量和所述第二關鍵詞向量導入所述評分模型,得到所述第二關鍵詞向量所對應的候選推送信息被點擊的概率。
5.根據權利要求4所述的方法,其特征在于,所述第一搜索用信息集合中的每條第一搜索用信息所對應的推送信息集合中的至少兩條推送信息來源于不同的網站,并且對于所述測試樣本集合中的各個測試樣本所包括的測試用信息對中的各條測試用信息,所述各條測試用信息中的至少兩條測試用信息來源于不同的網站。
6.根據權利要求5所述的方法,其特征在于,所述基于所述預測結果中的錯誤結果,對所述第一搜索用信息集合中的第一搜索用信息所對應的推送信息集合中的推送信息的優先級進行調整,包括:
將所述錯誤結果所對應的測試用信息基于所歸屬的網站進行聚類,得到多個測試用信息組;
將所述多個測試用信息組中的所包括的測試用信息條數最多的測試用信息組所對應的網站作為目標網站,對所述第一搜索用信息集合中的第一搜索用信息所對應的推送信息集合中的來源于所述目標網站的推送信息的優先級進行調整。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710700721.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于信息增益的英文社交媒體賬號分類方法
- 下一篇:一種數據清洗方法





