[發明專利]搜索結果排序方法及系統、搜索結果排序優化方法及系統在審
| 申請號: | 201210254425.6 | 申請日: | 2012-07-20 |
| 公開(公告)號: | CN103577413A | 公開(公告)日: | 2014-02-12 |
| 發明(設計)人: | 林鋒;湯佳宇 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 蘇培華 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 開曼群島;KY |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 搜索 結果 排序 方法 系統 優化 | ||
技術領域
本申請涉及計算機數據處理技術領域,特別是涉及一種搜索結果排序方法及系統、搜索結果排序優化方法及系統。
背景技術
隨著電子商務的發展,越來越多的用戶選擇在電子商務網站進行商品的購買。一般情況下一個電子商務網站,通常擁有千萬甚至幾億的產品,用戶要在繁多的產品中找到自己需要的,利用關鍵詞進行搜索是常見的一種方法。所謂搜索,即用戶輸入關鍵詞,網站返回與關鍵詞相關的搜索結果供用戶篩選。
在很多情況下,一個關鍵詞可能會有較大數量的搜索結果,那么搜索結果在展示必然需要按照一定的順序排列,如何對這些搜索結果進行排序需要網站進行綜合考慮。例如,可以根據搜索結果與關鍵詞的相關性、搜索結果在之前的點擊率、成交情況等等。對于電子商務網站來說,其主要目的是提高商品的銷售量,因此,其在對搜索結果進行排序時除了考慮相關性,還需要考慮搜索結果的可成交性,例如成交轉化率、好評率等等。
目前,常見的電子商務網站對搜索結果進行排序時,相關性和可成交性預測主要通過人工對歷史數據進行分析并根據經驗來確定搜索結果(即具體商品)的特征和權重,并根據一定公式計算得到。其中,商品特征是指能夠影響商品可成交性的因素,例如銷售量、好評率、成交轉化率等等。因為在確定特征和權重時憑經驗設定,較為盲目和主觀,往往會與實際情況出現誤差。因此,其返回的排序后的搜索結果可能與用戶期望會出現較大的差異,用戶期望的搜索結果可能被排在靠后的位置,因為搜索結果數量通常較大,為了減少數據傳輸量,服務器通常會分段返回排序后的搜索結果,先返回部分結果,若用戶提交請求,則再返回部分結果。當排序后的搜索結果與用戶期望出現較大差異時,那么用戶則可能不斷的請求查看剩余搜索結果或者重新通過客戶端向服務器提交新的搜索請求來獲取其所期望的搜索結果。那么就會增加服務器的數據傳輸量,那么這無疑會增加服務器的負載,占用大量的網絡資源,甚至可能造成網絡堵塞。同時也說明服務器返回的排序后的搜索結果中有大量的無關數據,這部分數據的傳輸無疑是對服務器資源和網絡資源的浪費和不必要的占用。
發明內容
本申請提供一種搜索結果排序方法及系統、搜索結果排序優化方法及系統,能夠解決搜索結果與用戶預期不同,用戶通過客戶端反復的發送搜索請求而導致的服務器負擔增加以及網絡堵塞的問題。
為了解決上述問題,本申請公開了一種搜索結果排序方法,包括以下步驟:
獲取原始特征集合,所述原始特征包括預先設定的可能對搜索結果的排序產生影響的特征;
基于歷史交易數據從原始特征集合提取有效特征,所述有效特征指根據歷史交易數據確定的能夠對搜索結果的排序產生影響的特征;
基于歷史交易數據確定各有效特征的初始權重,并利用歷史交易數據和預定訓練模型對初始權重進行訓練得到最終權重;
基于所述有效特征的最終權重對搜索結果進行排序。
進一步地,所述基于歷史交易數據從原始特征集合提取有效特征包括:
基于歷史交易數據選取兩組測試產品,其中一組為有成交記錄的產品,另外一組為沒有成交記錄的產品;
從歷史交易數據中分別提取所述兩組測試產品在一定時間段內的相關數據,并利用所述相關數據計算兩組測試產品各原始特征的特征值;
比較所述兩組測試產品相同原始特征的特征值的差值,若超過閾值,則選取所述原始特征為有效特征。
進一步地,所述基于歷史交易數據從原始特征集合提取有效特征包括:
從歷史交易數據中提取預定時間段內的交易數據,計算該預定時間段內各產品的成交轉化率;
選取成交轉化率差值大于閾值的兩組產品作為測試產品;
從歷史交易數據中提取所述兩組測試產品在所述預定時間段之后的一定時間段內的交易數據,并計算兩組測試產品的原始特征集合中各原始特征的特征值;
比較所述兩組測試產品相同原始特征的特征值的差值,若超過閾值,則選取所述原始特征為有效特征。
進一步地,所述基于歷史交易數據確定各有效特征的初始權重,并利用歷史交易數據和訓練模型對初始權重進行訓練得到最終權重包括:
確定有效特征的初始權重;
將歷史交易數據和初始權重代入預定訓練模型中,計算理論數據;
比較理論數據與實際數據,若二者差異在預定范圍內,則確定該初始權重為有效特征的最終權重,反之,則返回確定有效特征的初始權重這一步驟。
進一步地,所述基于所述有效特征的最終權重對搜索結果進行排序包括:
確定搜索結果的實際有效特征值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210254425.6/2.html,轉載請聲明來源鉆瓜專利網。





