[發明專利]利用從結構化文檔中提取的特征來改善搜索關聯性有效
| 申請號: | 201280037502.0 | 申請日: | 2012-07-23 |
| 公開(公告)號: | CN103718178A | 公開(公告)日: | 2014-04-09 |
| 發明(設計)人: | R.R.梅塔;S.H.納加拉盧;A.達斯;B.米特拉 | 申請(專利權)人: | 微軟公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 李舒;汪揚 |
| 地址: | 美國華*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 利用 結構 文檔 提取 特征 改善 搜索 關聯性 | ||
1.?一種便于相對于接收到的查詢對文檔進行排名的方法,所述方法包括:
在通用搜索引擎處,從用戶接收查詢,所述查詢被配置成檢索被所述通用搜索引擎索引的至少一個文檔;以及
使處理器至少部分地基于所述查詢將文檔的排名列表輸出給所述用戶,文檔的排名列表包括半結構化web頁面,所述半結構化web頁面在文檔的排名列表中的位置至少部分地基于被從所述半結構化文檔中提取的在所述半結構化文檔中的學習的位置處的特征的值,所述半結構化文檔已知包括所述特征,其中所述半結構化文檔在文檔的排名列表中的位置獨立于所述查詢的文本與所述特征的值之間的任何相關性。
2.?根據權利要求1所述的方法,其中所述半結構化web頁面是描述產品的零售商頁面,并且其中所述特征是由產品的購買人在所述半結構化web頁面上所張貼的評論的總數、由所述產品的購買人在所述半結構化web頁面上所張貼的肯定評論的總數、或由所述產品的購買人在所述半結構化web頁面上所張貼的否定評論的總數中的至少一個。
3.?根據權利要求1所述的方法,其中所述半結構化web頁面是包括視頻的web頁面,并且其中所述特征是由所述web頁面上的所述視頻的觀看者對所述視頻的瀏覽數的數目。
4.?根據權利要求1所述的方法,其中所述半結構化web頁面是在社交聯網站點上的實體的簡檔頁面,并且其中所述特征是所述實體的聯系人的數目。
5.?根據權利要求1所述的方法,進一步包括:
自動地從多個半結構化web頁面中提取特征,其中所述特征被自動地從所述半結構化web頁面中在學習的位置處提取。
6.?一種便于響應于查詢的接收來輸出搜索結果的排名列表的系統,所述系統包括:
接收器構件,其從用戶接收查詢;以及
排名器構件,其響應于所述查詢的接收來輸出文檔的排名列表,文檔的排名列表包括在文檔的排名列表之中的位置處的半結構化web頁面,在文檔的排名列表之中的所述位置至少部分地基于在所述半結構化web頁面中的學習的位置處的特征的值,所述半結構化web頁面在文檔的排名列表之中的位置獨立于所述查詢與所述特征的值之間的任何相關性。
7.?根據權利要求6所述的系統,其被通用搜索引擎包括。
8.?根據權利要求6所述的系統,其中所述半結構化web頁面是被配置用于產品的銷售的web頁面,并且其中所述特征是由所述產品的購買人在所述web頁面上所張貼的評論的數目、由所述產品的購買人在所述web頁面上所張貼的肯定評論的數目、或由所述產品的購買人在所述web頁面上所張貼的否定評論的數目中的一個。
9.?根據權利要求6所述的系統,其中所述半結構化web頁面是被配置用于產品的銷售的web頁面,并且其中所述特征是在由所述產品的購買人在所述web頁面上所張貼的所述產品的評論中標記為肯定的術語的數目或在由所述產品的購買人在所述web頁面上所張貼的所述產品的評論中標記為否定的術語的數目中的一個。
10.?根據權利要求6所述的系統,進一步包括學習器構件,其通過包裝器歸納來學習包裝器,其中所述包裝器自動地從半結構化web頁面中提取特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟公司,未經微軟公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201280037502.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:針灸針包裝機的自動下管裝置
- 下一篇:一種小袋裝茶葉水平包裝機





