[發明專利]搜索排序器的自動選擇有效
| 申請號: | 201910341352.6 | 申請日: | 2019-04-26 |
| 公開(公告)號: | CN110413763B | 公開(公告)日: | 2023-06-09 |
| 發明(設計)人: | D·考赫恩;S·埃瑞拉;H·瑞特曼;B·維內爾 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06F16/335 | 分類號: | G06F16/335;G06F16/338;G06F16/35 |
| 代理公司: | 中國貿促會專利商標事務所有限公司 11038 | 代理人: | 李穎 |
| 地址: | 美國*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 搜索 排序 自動 選擇 | ||
本公開涉及搜索排序器的自動選擇。一種用于搜索結果排序器的自動選擇的方法,包括:提供一組查詢;對于每個所述查詢,從搜索引擎接收多個相關性分數集合,其中每個相關性分數集合與利用多個計算機化搜索結果排序器中的每一個在電子文檔的語料庫中找到的搜索結果關聯;根據與所述查詢關聯的所述多個相關性分數集合,計算每個所述查詢相對于所述一組搜索查詢中的所有其他查詢的難度分數;根據與所述搜索結果排序器關聯的所述多個相關性分數集合,計算每個所述搜索結果排序器的質量分數,其中所述多個相關性分數集合中的每一個按照其關聯的查詢的難度分數被加權;和根據所述質量分數,選擇所述搜索排序器之一。
技術領域
本發明涉及計算機化信息檢索(IR)的領域。
背景技術
許多信息檢索任務涉及基于每個均在包含許多電子文檔的語料庫(corpora)中被搜索的多個搜索項來檢索文檔。
信息檢索任務可以表述為:給定文檔集或或語料庫和搜索查詢,從語料庫中檢索最可能與搜索查詢相關的文檔的排序列表。
選擇正確的檢索策略是一項具有挑戰性的任務,它取決于文檔語料庫、搜索查詢集和最終用戶。許多IR系統在響應用戶的查詢時,在檢索性能上存在很大差異。即使對于通常完成良好的系統,對于一些查詢返回的結果的質量也較差,這會導致用戶不滿。
于是,在IR領域中,預先估計響應于查詢而進行的搜索的有效性的能力是備受關注的。一些方法需要檢索后的相關性判斷,以訓練用于受監督的排序器選擇的決策模型。不過,在缺乏相關性判斷的情況下,可以使用查詢性能預測(QPP)方法來估計搜索質量,從而用于檢索策略選擇。
現有技術的上述例子及與之相關的限制是例證性的,而不是排他性的。當閱讀說明書和研究附圖時,對本領域的技術人員來說,現有技術的其他限制將變得明顯。
發明內容
結合示例性和說明性的而不是對范圍的限制的系統、工具和方法,舉例說明以下實施例及其各個方面。
按照實施例,提供一種用于搜索結果排序器的計算機化自動選擇的方法,所述方法包括操作至少一個硬件處理器以提供一組計算機化搜索查詢;對于每個所述搜索查詢,從計算機化搜索引擎,接收多個相關性分數集合,其中每個相關性分數集合與利用多個計算機化搜索結果排序器中的每一個在電子文檔的語料庫中找到的搜索結果關聯;根據與所述搜索查詢關聯的所述多個相關性分數集合,計算每個所述搜索查詢相對于所述一組搜索查詢中的所有其他搜索查詢的難度分數;根據與所述搜索結果排序器關聯的所述多個相關性分數集合,計算每個所述搜索結果排序器的質量分數,其中所述多個相關性分數集合中的每一個按照其關聯的搜索查詢的難度分數被加權;和根據所述質量分數,選擇所述搜索排序器之一。
按照實施例,還提供一種用于搜索結果排序器的自動選擇的計算機程序產品,所述計算機程序產品包括其中包含有程序代碼的非臨時性計算機可讀存儲介質,所述程序代碼可由至少一個硬件處理器執行,以提供一組計算機化搜索查詢;對于每個所述搜索查詢,從計算機化搜索引擎,接收多個相關性分數集合,其中每個相關性分數集合與利用多個計算機化搜索結果排序器中的每一個在電子文檔的語料庫中找到的搜索結果關聯;根據與所述搜索查詢關聯的所述多個相關性分數集合,計算每個所述搜索查詢相對于所述一組搜索查詢中的所有其他搜索查詢的難度分數;根據與所述搜索結果排序器關聯的所述多個相關性分數集合,計算每個所述搜索結果排序器的質量分數,其中所述多個相關性分數集合中的每一個按照其關聯的搜索查詢的難度分數被加權;和根據所述質量分數,選擇所述搜索排序器之一。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910341352.6/2.html,轉載請聲明來源鉆瓜專利網。





