[發(fā)明專利]用于搜索記分的方法和設(shè)備有效
| 申請?zhí)枺?/td> | 201310495397.1 | 申請日: | 2004-09-30 |
| 公開(公告)號: | CN103678481A | 公開(公告)日: | 2014-03-26 |
| 發(fā)明(設(shè)計(jì))人: | 王學(xué)軍;布賴恩·埃克坦;文卡特·潘查帕克森 | 申請(專利權(quán))人: | 雅虎公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q30/06 |
| 代理公司: | 北京東方億思知識產(chǎn)權(quán)代理有限責(zé)任公司 11258 | 代理人: | 李曉冬 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 搜索 記分 方法 設(shè)備 | ||
本申請是申請日為2004年9月30日,申請?zhí)枮?00480030053.2,名稱為“用于搜索記分的方法和設(shè)備”的發(fā)明專利申請的分案申請。
技術(shù)領(lǐng)域
本發(fā)明涉及用于對搜索結(jié)果進(jìn)行記分或分級的方法和設(shè)備。更具體而言,本發(fā)明涉及基于事務(wù)和/或點(diǎn)擊記錄的記分方法。
背景技術(shù)
隨著因特網(wǎng)上大量信息的增殖,通常,如果不首先花大量時(shí)間來仔細(xì)察看許多不相關(guān)搜索結(jié)果就很難搜索和定位相關(guān)信息。根據(jù)所尋求的材料,用戶常常由于必須查看許多無關(guān)緊要的搜索結(jié)果而感到受挫。
記分或分級是搜索中的核心問題之一,例如在購物/產(chǎn)品搜索中尤其如此。如果搜索不能在搜索結(jié)果列表的頂部處提供最相關(guān)的文檔,則這通常被稱為不相關(guān)(irrelevant)。比起常規(guī)web搜索來,對于諸如購物/產(chǎn)品搜索這樣的搜索,用戶往往具有更高的相關(guān)性(relevancy)要求,因?yàn)樗麄兊哪繕?biāo)不僅僅是找到一個(gè)相關(guān)結(jié)果。它們常常希望看到最相關(guān)的產(chǎn)品,并且希望能夠在不同產(chǎn)品和不同商家之家進(jìn)行比較。
基于純文本相關(guān)性的記分是若干搜索技術(shù)的基礎(chǔ)。基本思想是找到匹配文檔標(biāo)題、描述和其他字段的文本。可以添加額外的細(xì)化,例如向某些字段(比如標(biāo)題)提供更高的權(quán)重、向短語匹配提供更高的權(quán)重等等。但是,所有這些純文本相關(guān)性記分方法都有生成最相關(guān)的搜索結(jié)果的問題,因?yàn)樗鼈儾荒芫_地確定用戶想要搜索什么。
例如,在純文本相關(guān)性搜索中,當(dāng)搜索詞語“computer(計(jì)算機(jī))”時(shí),具有像“Sony?VAIO?FX340”這樣的標(biāo)題的文檔不會被視為良好的文本匹配,因?yàn)闃?biāo)題不包含詞語“computer”,而具有像“computer?case(計(jì)算機(jī)殼)”這樣的標(biāo)題的文檔卻會被視為良好的匹配。這個(gè)示例證明了對computer的搜索很可能會產(chǎn)生具有許多不相關(guān)項(xiàng)目的搜索結(jié)果。
即使在所有結(jié)果都被認(rèn)為是相關(guān)的時(shí),仍然優(yōu)選向更受歡迎的產(chǎn)品提供更高的得分或等級。但是,純文本相關(guān)性搜索將不能提供這種重要區(qū)別。
因此,本領(lǐng)域中需要一種提供具有更高相關(guān)性的搜索結(jié)果的方法和設(shè)備。
發(fā)明內(nèi)容
在一個(gè)實(shí)施例中,本發(fā)明提供了一種用于生成具有更高相關(guān)性的搜索結(jié)果的方法和設(shè)備。例如,本發(fā)明提供了一種為購物/產(chǎn)品搜索生成具有更高相關(guān)性的搜索結(jié)果的方法和設(shè)備。
本發(fā)明的一個(gè)前提是:用戶通過購買和/或點(diǎn)擊其所喜愛的產(chǎn)品,從而針對受歡迎的搜索詞語廣播了其關(guān)于最喜愛的產(chǎn)品的偏好。當(dāng)用戶在購買/產(chǎn)品搜索站點(diǎn)中搜索一個(gè)詞語時(shí),雖然該站點(diǎn)可能返回許多不相關(guān)的結(jié)果,但是許多用戶可以就通過選擇其所感興趣的結(jié)果(即相關(guān)結(jié)果)來過濾掉不相關(guān)的結(jié)果。這在用戶確實(shí)從搜索結(jié)果列表中購買產(chǎn)品時(shí)尤其精確,從而不僅指示了搜索詞語的結(jié)果的相關(guān)性,還指示了所購買的產(chǎn)品的價(jià)格的相關(guān)性和/或銷售所購買的產(chǎn)品的商家的相關(guān)性。
本發(fā)明利用了以下事實(shí):用戶對每個(gè)給定搜索詞語的選擇往往會覆蓋來自若干個(gè)商家的若干個(gè)產(chǎn)品,并且所有結(jié)果都是與搜索詞語非常相關(guān)的。在一個(gè)實(shí)施例中,這些結(jié)果被用于判定每個(gè)搜索詞語的商家的順序。通過獲知用戶的選擇,尤其是從購買和/或點(diǎn)擊信息中獲知用戶的選擇,比起僅限文本相關(guān)的產(chǎn)品來,高度相關(guān)并且最受歡迎的產(chǎn)品可以被分配以更高的得分或等級。
附圖說明
通過參考附圖,從以下對本發(fā)明的優(yōu)選實(shí)施例的詳細(xì)描述中更好地理解前述和其他方面和優(yōu)點(diǎn),附圖中:
圖1是示出本發(fā)明的記分系統(tǒng)的框圖;
圖2示出應(yīng)用本記分方法來影響搜索結(jié)果中的文檔的列出順序的關(guān)系;
圖3示出用于生成多個(gè)產(chǎn)品的熱得分(hotscore)的方法的流程圖;
圖4示出用于對銷售和點(diǎn)擊數(shù)據(jù)進(jìn)行預(yù)處理的方法的流程圖;
圖5示出用于計(jì)算配置參數(shù)α的方法的流程圖;
圖6示出本發(fā)明的用于生成熱得分的方法的流程圖;
圖7示出本發(fā)明的用于調(diào)整熱得分的方法的流程圖;以及
圖8示出本發(fā)明的用于調(diào)整熱得分的第二方法的流程圖。
具體實(shí)施方式
圖1是示出本發(fā)明的記分系統(tǒng)100的框圖。記分系統(tǒng)100的任務(wù)是為根據(jù)搜索詞語生成的搜索結(jié)果集合內(nèi)的文檔(例如產(chǎn)品)記分。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于雅虎公司,未經(jīng)雅虎公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310495397.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種程序界面設(shè)計(jì)裝置
- 下一篇:寬頻譜電磁屏蔽光窗
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)





