[發明專利]搜索引擎有效
| 申請號: | 201710908835.0 | 申請日: | 2017-09-29 |
| 公開(公告)號: | CN107958014B | 公開(公告)日: | 2021-11-09 |
| 發明(設計)人: | S.R.加德里;陶學軍;田野;M.考特尼;陳佩君;C.波斯 | 申請(專利權)人: | 谷歌公司 |
| 主分類號: | G06F16/953 | 分類號: | G06F16/953;G06F16/33 |
| 代理公司: | 北京市柳沈律師事務所 11105 | 代理人: | 邵亞麗 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 搜索引擎 | ||
1.一種用于執行搜索的方法,包括:
定義向量詞匯表;
定義包括多個不同職業的職業分類;
獲得多個標記的訓練數據項,其中每個標記的訓練數據項至少與(i)職位、和(ii)職業相關聯;
為相應的標記的訓練數據項中的每一個生成包括用于所述向量詞匯表中的每個相應術語的特征權重的職業向量,所述特征權重基于(i)表示反向職業頻率的值,該反向職業頻率基于職業分類中的職業的數量所確定,其中相應的訓練數據項的職位中的每個相應的項存在于職業分類中,以及(ii)表示職業導數的值,該職業導數基于跨越職業分類中相應的職業中的每一個的相應的訓練數據項的職位中每個相應術語的密度;
基于用于生成所述職業向量的所述標記的訓練數據項的職業,將每個相應職業向量與所述職業分類中的職業相關聯;
接收包括與一個或多個潛在工作機會的特征有關的字符串的搜索查詢;
基于所接收的查詢生成第一向量;
針對所述職業分類中的多個職業的每個相應職業確定指示查詢向量是否在相應職業中被正確分類的置信度;
選擇與最高置信度相關聯的特定職業;
使用所選職業獲得一個或多個工作崗位;以及
響應于所述搜索查詢,提供在搜索結果的集合中所獲得的工作崗位。
2.如權利要求1所述的方法,其中定義向量詞匯表包括生成包括存在于存儲在文本語料庫中的至少一個訓練數據項中的術語和不存在于存儲在所述文本語料庫中的至少一個訓練數據項中的術語的向量詞匯表。
3.如權利要求1所述的方法,其中定義向量詞匯表包括生成僅僅包括存在于存儲在文本語料庫中的至少一個訓練數據項中的術語的向量詞匯表。
4.如權利要求1所述的方法,其中所述特征權重至少部分地基于表示術語頻率的第一值,所述術語頻率至少部分地基于所述相應的訓練數據項的職位中的每個相應術語的出現次數所確定。
5.如權利要求1所述的方法,其中所述特征權重至少部分地基于表示反向職業頻率的第二值,所述反向職業頻率至少部分地基于所述職業分類中的職業的數量所確定,其中相應的訓練數據項的職位中的每個相應的術語存在于所述職業分類中。
6.如權利要求1所述的方法,其中所述特征權重至少部分地基于表示職業導數的第三值,所述職業導數至少部分地基于跨越所述職業分類中的相應的職業中的每一個的相應的訓練數據項的職位中每個相應術語的密度。
7.如權利要求1所述的方法,其中所述特征權重至少部分地基于(i)表示所述反向職業頻率的第二值以及基于(ii)表示職業導數的第三值兩者,所述反向職業頻率至少部分地基于職業分類中的職業的數量來確定,其中相應訓練數據項的職位中的每個相應的術語存在于所述職業分類中,所述職業導數至少部分地基于跨越所述職業分類中的相應的職業中的每一個的相應的訓練數據項的職位中每個相應術語的密度。
8.如權利要求7所述的方法,其中所述特征權重基于(i)表示所述反向職業頻率的第二值和(ii)表示所述職業導數的所述第三值的三分之一的和。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于谷歌公司,未經谷歌公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710908835.0/1.html,轉載請聲明來源鉆瓜專利網。





