[發明專利]數據搜索處理方法和系統在審
| 申請號: | 201410123992.7 | 申請日: | 2014-03-28 |
| 公開(公告)號: | CN104951468A | 公開(公告)日: | 2015-09-30 |
| 發明(設計)人: | 沈晶晶 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京國昊天誠知識產權代理有限公司 11315 | 代理人: | 許志勇 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 開曼群島;KY |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 搜索 處理 方法 系統 | ||
技術領域
本申請涉及數據搜索領域,尤其涉及一種數據搜索處理方法和系統。
背景技術
隨著互聯網技術的發展,越來越多的用戶通過網絡訪問進行數據搜索,并獲得反饋的搜索結果。根據搜索請求執行搜索并提供結果的服務器端的數據搜索處理技術對實現用戶的搜索目的起著重要作用,比如,如何對搜索結果處理以得到最符合用戶需求的結果,如何處理搜索結果以提高服務器的處理性能,優化數據管理效率等。現有的搜索處理技術,根據用戶的搜索請求,由搜索引擎、關聯引擎分別根據查詢詞(如:關鍵詞)找到,即搜索引擎找到數據對象、擴展引擎找到基于數據對象的擴展信息,然后,將數據對象和基于數據對象的擴展信息進行處理調整后一并返回輸出,如:將找到的基于數據對象的擴展信息嵌入到找到的數據對象結果中,一并展示給輸入查詢詞的用戶。
常見的一種應用即為商品搜索引擎中,將收費廣告內嵌到搜索結果內,具體地,如圖1A所示。(1)用戶通過瀏覽器訪問商品搜索網站,輸入商品查詢詞,并按下搜索按鈕請求搜索。(2)瀏覽器訪問網站的應用服務器。(3)應用服務器向廣告引擎請求針對這次搜索的廣告結果(基于商品的廣告創意結果),同時還向搜索引擎請求針對這次搜索的商品搜索結果;(i)其中,廣告引擎按照一定的邏輯返回廣告結果,比如:按照查詢詞來匹配廣告主購買的關鍵字,得到符合條件的廣告商品,然后按照廣告預期最大收益(類似考慮廣告出價、匹配度、創意質量等)來決定排序,取前m(top?m)個廣告商品的廣告創意作為結果返回;(ii)其中,搜索引擎按照一定的邏輯返回搜索結果,比如:按照查詢詞來匹配商品的文本描述,得到符合條件的商品,然后按照相關性、商品質量等維度而計算出的商品與發出搜索請求的用戶的需求的匹配程度,來決定輸出的商品排序,取前n(top?n)個商品作為結果返回。(4)應用服務器取得廣告結果和搜索的商品結果,進行計算,比如從搜索的商品結果中濾除廣告結果中已經存在的對應商品(廣告商品);對計算后的結果進行合并,調整排序;對頁面進行渲染,返回結果到瀏覽器以展示給發出搜索請求的用戶。
由圖1A的過程,搜索結果返回輸出,以“商品交易平臺搜索”為例子,將收費廣告展現在搜索到的商品旁邊,如頭部、尾部、右邊欄等,作為搜索結果的一部分,如圖2所示的右邊欄。這里,廣告部分獨立展示,可以由瀏覽器直接訪問來自廣告引擎取得的廣告結果,直接展現在相應的廣告位置,能縮短頁面處理時間。另外,還可以由圖1B所示的搜索結果返回輸出方式,如圖3所示“競價排名”展示,收費廣告內嵌到搜索結果中,輸出搜索結果到網頁時,收費廣告還用一方框圈定。這里,廣告結果和搜索結果混在一起,將得到的廣告結果以及得到的搜索結果做混排后(如利用混合排序服務器),應用服務器再將混排的結果傳到瀏覽器。
兩種搜索處理后的展示輸出方式,都是在一個頁面中展示搜索引擎的結果和廣告引擎的結果。但是,兩種方式都存在一定缺陷。
其一,由于最終展現的結果為兩個引擎的結果合并產生,而兩個引擎對應的商品集合不同,排序算法不同,最終返回的結果展示出現不連續、不相關的不良效果,導致用戶的體驗不一致,尤其在混排廣告結果和搜索結果的時候更突出,因此,由于兩個引擎采用的排序邏輯不一致,導致最終返回輸出的結果效果差、缺乏連續性和相關性,進而導致用戶體驗不一致的缺陷。
例如:商品總的集合為A、B、C、D、E、F,其中參加廣告的商品集合為C、D、E,則搜索引擎的商品集合為商品全集A~F,廣告引擎的商品集合為廣告商品C~D。用戶發起的搜索存在的可能性有:搜索引擎返回結果A、C、F,廣告引擎返回結果C、E,混排后展示給用戶ACEF。由于ACF按照搜索引擎排序規則展示,E插入其中后會迷惑用戶判斷。從廣告排序角度看即使E的文本描述和用戶查詢詞無密切關聯,如果E出價很高仍會返回給用戶,此時整體結果給用戶的體驗是相關性差、不連續、不一致。
其二,現有技術中,應用服務器需要請求兩個引擎,兩個引擎的目標不一致,各自考慮的排序條件就不一致,返回輸出最終結果需要對兩個引擎的目標結果進行合并、去重等操作,從而導致同樣對象的最終排序不一致,因而,導致增加了混排、去重等繁瑣的運算處理,加大計算機系統的復雜度、以及造成計算機系統處理效率低下。
因此,需要對現有技術的上述數據搜索處理的方案進行改進以提高效率、為用戶提供一致而良好的用戶體驗。
發明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410123992.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種管理數據庫連接的方法和裝置
- 下一篇:數據存儲方法及系統
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





