[發明專利]概念上組織和表述信息的方法和系統有效
| 申請號: | 201110282837.6 | 申請日: | 2004-12-07 |
| 公開(公告)號: | CN102354313A | 公開(公告)日: | 2012-02-15 |
| 發明(設計)人: | A·柯蒂斯;A·萊文;A·杰拉索利斯 | 申請(專利權)人: | IAC搜索和媒體公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京潤平知識產權代理有限公司 11283 | 代理人: | 周建秋;王鳳桐 |
| 地址: | 美國加*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 概念上 組織 表述 信息 方法 系統 | ||
本申請是申請號為200480035838.9、申請日為2004年12月7日、名稱為“概念上組織和表述信息的方法和系統”的中國發明專利申請的分案申請。
優先權要求
本申請涉及并且要求2003年12月8日提交的臨時申請號60/528,139的優先權,其內容作為引用結合于此。
相關申請
本申請涉及2004年5月24號提交的名稱為“METHODS?AND?SYSTEMS?FOR?CONCEPTUALLY?ORGANIZING?AND?PRESENTING?INFORMATION”的美國專利申請,其內容作為引用結合于此。
技術領域
本發明的實施例一般的涉及概念上的組織信息的領域,并且尤其涉及概念相關信息的使用分析以有效組織信息。
背景技術
隨著信息的迅速增長,組織信息的能力也在增長。在互聯網相關的網絡(例如萬維網)或者其他互聯網源上可以找到大量信息源。互聯網是計算機網絡的擴展網絡,信息通過本領域技術人員公知的方法(例如TCP和IP協議的使用等等)而在互聯網上交換。互聯網允許用戶在連接到該網絡的計算機之間發送和接收數據。這些數據可以包括網站、主頁、數據庫、文本集合、音頻、視頻或者通過連接到互聯網的計算機服務器在互聯網上可用的任何其他類型的信息。這些信息可以被稱為文件或者文檔,并且可以包括網頁、網頁上的數據、網頁附件或者存儲設備(例如數據庫)中包含的其他數據。
理解如此大量文檔集合的意義并且在這種環境中搜索信息,在沒有專門的輔助手段時是很困難的。一種輔助定位信息的方法是使用關鍵詞。也就是說,文檔可以包括表示包含在文檔中的信息的選定部分的關鍵詞。這些關鍵詞在互聯網上對其他計算機是可用的并且允許其他計算機定位該文檔。
為了定位互聯網上的文檔,遠程計算機的用戶使用被稱為搜索引擎的搜索程序而搜索關鍵詞。搜索引擎是允許遠程用戶鍵入一個或多個搜索詞的程序。然后搜索引擎將搜索查詢與文檔中的關鍵詞相比較并且至少檢索文檔中具有與搜索查詢匹配的關鍵詞的部分。然后搜索引擎對用戶顯示部分文檔,例如標題。用戶可以在檢索到的局部文檔中滾動瀏覽并且選擇所需文檔。
早期的關鍵詞搜索引擎顯示出嚴重缺陷。例如,為了增加特定文檔的出現率,文檔提供者可以使用與文檔相關的盡可能多的搜索詞。實際上,某些文檔或者搜索引擎使用文檔中的每個詞作為關鍵詞。因此,搜索引擎會檢索到大量與用戶需要通過搜索詞組合尋找的主題無關或者僅邊緣相關的文檔。并且,這些搜索引擎的很多用戶并不熟悉形成關鍵詞搜索查詢的技巧并且產生過于寬泛的搜索從而經常檢索到數千個文檔。那么用戶必須檢查關于各個文檔的摘要信息以定位所需信息。
這種缺陷通過搜索引擎的演變得以解決,即包括基于一個或多個用戶的搜索活動的信息組織。這些方法基于用戶偏好度多數意見而不是面向文檔的參數(例如文本)而對結果排序。其中一種這樣的方法根據基于所使用的關鍵詞的演化得分而對文檔排序。也就是說,文檔接收與搜索查詢的關鍵詞相關的相關度分數。隨著用戶輸入搜索查詢并且在查詢產生的文檔列表中選擇文檔時,文檔的相關度分數被調整。這些分數被用于組織文檔的結果列表以進行后續搜索。這些方法典型的(至少在部分上)基于文檔接收到的“點擊”次數(即文檔被選擇的次數)而確定相關度。這些方法通常稱為“人氣排序方法”或者“點擊人氣方法”,提供了將最吸引并且滿足最大多數先前用戶的文檔排列在最前面的搜索結果列表。而且,點擊人氣方法產生反映搜索上下文的結果。例如,先前的搜索方法會返回包含所有查詢詞的文檔,但是不會自動排除不是查詢部分的詞。因此,對于“Mexico”的文本匹配搜索最有可能返回關于“New?Mexico”的結果。點擊人氣方法可以減少這種錯誤結果,因為搜索“Mexico”的用戶通常不會點擊關于“New?Mexico”的頁面并且會傾向于點擊他們認為與“Mexico”最相關的頁面,從而增加了所需文檔的相關度。
由于與查詢詞相關的信息隨著時間可能改變,基于點擊次數確定相關度可能導致錯誤結果。例如,對于“民主先驅”的特定查詢,涉及早期先驅Howard?Dean的文檔可能在2003年12月被選擇了很多次,但是2004年3月輸入該查詢的用戶可能期望在此時作為領袖的John?Kerry的結果。并且,排在最前面的結果通常會受到不成比例的更多的使用,這樣導致了越來越歪曲的搜索結果,其中排在最前面的結果永遠不會被替代。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于IAC搜索和媒體公司,未經IAC搜索和媒體公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110282837.6/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





