[發明專利]預測搜索引擎排名信號值有效
| 申請號: | 201780074815.6 | 申請日: | 2017-12-04 |
| 公開(公告)號: | CN110023928B | 公開(公告)日: | 2020-12-04 |
| 發明(設計)人: | 雅維耶·斯帕尼奧洛·阿里薩瓦拉加;馬爾特·努恩;國·V·勒;丹尼爾·杜克沃特;馬蒂亞斯·海勒爾 | 申請(專利權)人: | 谷歌有限責任公司 |
| 主分類號: | G06F16/958 | 分類號: | G06F16/958;G06F16/95 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 李寶泉;周亞榮 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 預測 搜索引擎 排名 信號 | ||
1.一種擴增第一搜索引擎索引的方法,所述第一搜索引擎索引對來自第一資源集合的資源進行索引,所述方法包括:
由一個或多個計算機維護第一搜索引擎索引,所述第一搜索引擎索引對來自第一資源集合的資源進行索引并且將來自所述第一資源集合的多個資源中的每個資源與該資源的搜索引擎排名信號的相應值相關聯,其中所述搜索引擎排名信號的該相應值是與表征該資源的所述搜索引擎排名信號相對應的特定類型的文本;
由所述一個或多個計算機在所述第一資源集合中識別第一資源,(i)所述第一資源在所述第一搜索引擎索引中被索引并且(ii)在所述第一搜索引擎索引中所述第一資源的所述搜索引擎排名信號的實際值不可用;
由所述一個或多個計算機使用機器學習模型處理來自所述第一資源的文本,所述機器學習模型被配置為:
處理所述文本以生成被預測為表征所述資源的所述特定類型的文本;
由所述一個或多個計算機,通過以下操作來更新所述第一搜索引擎索引:在所述第一搜索引擎索引中,將由所述機器學習模型生成的文本作為所述搜索引擎排名信號的預測值來與所述第一資源相關聯;以及
向搜索引擎提供所述搜索引擎排名信號的預測值以代替所述搜索引擎排名信號的實際值,以供用于響應于接收到的搜索查詢而生成所述第一資源的排名分數。
2.根據權利要求1所述的方法,進一步包括:
從索引第二資源集合的第二搜索引擎索引識別多個第二資源,所述多個第二資源中的每個第二資源在所述第二搜索引擎索引中與該第二資源的搜索引擎排名信號的相應值相關聯;
生成訓練數據,所述訓練數據針對所述多個第二資源中的每個第二資源包括:
該第二資源的文本,以及
該第二資源的搜索引擎排名信號的相應值;以及
在所述訓練數據上訓練所述機器學習模型。
3.根據權利要求2所述的方法,其中,所述第二資源集合是互聯網資源的集合。
4.根據權利要求3所述的方法,其中,所述第一資源集合與所述第二資源集合不同。
5.根據權利要求4所述的方法,其中,所述第一資源集合是特定于實體的資源的集合。
6.根據權利要求1所述的方法,其中,由所述機器學習模型生成的文本包括用戶將提交給所述搜索引擎以搜索所述第一資源的一個或多個搜索查詢。
7.根據權利要求1所述的方法,其中,所述機器學習模型包括:
編碼器神經網絡,所述編碼器神經網絡被配置為處理所述第一資源的文本以生成所述第一資源的編碼表示;以及
第一解碼器神經網絡,所述第一解碼器神經網絡被配置為使用所述第一資源的所述編碼表示來生成被預測為表征資源的所述特定類型的文本。
8.根據權利要求7所述的方法,其中,所述搜索引擎在響應于接收到的搜索查詢而對資源進行排名時也使用的第二搜索引擎排名信號的值在所述第一搜索引擎索引中對于所述第一資源也不可用,以及其中,所述方法進一步包括:
使用第二解碼器神經網絡處理所述第一資源的所述編碼表示,所述第二解碼器神經網絡被配置為使用所述第一資源的所述編碼表示生成所述第二搜索引擎排名信號的預測值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于谷歌有限責任公司,未經谷歌有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780074815.6/1.html,轉載請聲明來源鉆瓜專利網。





