[發明專利]預測搜索引擎排名信號值有效
| 申請號: | 201780074815.6 | 申請日: | 2017-12-04 |
| 公開(公告)號: | CN110023928B | 公開(公告)日: | 2020-12-04 |
| 發明(設計)人: | 雅維耶·斯帕尼奧洛·阿里薩瓦拉加;馬爾特·努恩;國·V·勒;丹尼爾·杜克沃特;馬蒂亞斯·海勒爾 | 申請(專利權)人: | 谷歌有限責任公司 |
| 主分類號: | G06F16/958 | 分類號: | G06F16/958;G06F16/95 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 李寶泉;周亞榮 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 預測 搜索引擎 排名 信號 | ||
用于擴增搜索引擎索引的方法、系統和設備,包括被編碼在計算機存儲介質上的計算機程序,所述搜索引擎索引對來自資源集合的資源進行索引。在一個方面中,擴增對來自資源集合的資源進行索引的搜索引擎索引的方法包括以下所述動作:在所述資源集合中識別資源,所述資源在所述搜索引擎索引中被索引并且所述資源的搜索引擎排名信號的值不可用;使用機器學習模型處理來自所述資源的數據,所述機器學習模型被配置為:處理所述數據以預測所述資源的所述搜索引擎排名信號的值;以及通過將所述搜索引擎排名信號的預測值與所述搜索引擎索引中的所述資源相關聯來更新所述搜索引擎索引。
技術領域
本說明書通常涉及訓練機器學習模型,該機器學習模型預測被索引在搜索系統的索引數據庫中的資源的搜索引擎排名信號的值。
背景技術
在線搜索引擎通常響應于接收到的搜索查詢而對資源進行排名,以呈現識別響應于搜索查詢的資源的搜索結果。搜索引擎通常按照由排名限定的順序來呈現搜索結果。搜索引擎可以基于各種因素(即,基于各種搜索引擎排名信號)并且使用各種排名技術來對資源進行排名。
發明內容
本說明書描述了機器學習被集成到搜索引擎索引過程中的各種實施方式。描述了為在搜索系統的索引數據庫中被索引的資源生成搜索引擎排名信號的值的技術。
通常,本說明書中所描述的主題的一個創新方面可以體現在方法中,該方法擴增對來自第一資源集合的資源進行索引的第一搜索引擎索引。該方法包括:在第一資源集合中識別第一資源,該第一資源在第一搜索引擎索引中被索引并且該第一資源的搜索引擎排名信號的值不可用,其中,搜索引擎在響應于接收到的搜索查詢而對資源進行排名時使用搜索引擎排名信號的值;使用機器學習模型處理來自第一資源的數據,該機器學習模型被配置為:處理數據以預測第一資源的搜索引擎排名信號的值;以及通過將搜索引擎排名信號的預測值與第一搜索引擎索引中的第一資源相關聯來更新第一搜索引擎索引。來自第一資源的數據可以包括文本。該方面的其它實施例包括對應計算機系統、設備和記錄在一個或多個計算機存儲裝置上的計算機程序,每個計算機系統、設備和計算機程序都被配置為執行方法的動作。一個或多個計算機的系統被配置為執行特定操作或動作意味著系統已經在其上安裝了軟件、固件、硬件或其組合,其在操作中使系統執行操作或動作。一個或多個計算機程序被配置為執行特定操作或動作意味著一個或多個程序包括在由數據處理設備執行時使設備執行操作或行動的指令。
可選地,前述和其它實施例可以分別單獨地或組合地包括以下特征中的一個或多個。具體地,一個實施例組合地包括所有以下特征。該方法進一步包括:從索引第二資源集合的第二搜索引擎索引識別多個第二資源,該第二資源中的每一個在第二搜索引擎索引中與第二資源的搜索引擎排名信號的相應值相關聯;生成訓練數據,該訓練數據針對多個第二資源中的每一個包括:第二資源的數據(例如,文本),以及第二資源的搜索引擎排名信號的相應值;以及在訓練數據上訓練機器學習模型。第二資源集合是互聯網資源的集合。第一資源集合與第二資源集合不同。第一資源集合是特定于實體的資源的集合。第一資源的搜索引擎排名信號的預測值包括用戶將提交給搜索引擎以搜索第一資源的一個或多個搜索查詢。機器學習模型包括:編碼器神經網絡,該編碼器神經網絡被配置為處理第一資源的數據(例如,文本)以生成第一資源的編碼表示;以及第一解碼器神經網絡,該第一解碼器神經網絡被配置為使用第一資源的編碼表示生成搜索引擎排名信號的預測值。搜索引擎在響應于接收到的搜索查詢而對資源進行排名時也使用的第二搜索引擎排名信號的值對于第一資源也不可用,以及其中,該方法進一步包括:使用第二解碼器神經網絡處理第一資源的編碼表示,該第二解碼器神經網絡被配置為使用第一資源的編碼表示生成第二搜索引擎排名信號的預測值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于谷歌有限責任公司,未經谷歌有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780074815.6/2.html,轉載請聲明來源鉆瓜專利網。





