[發明專利]一種結果緩存替換的優化方法有效
| 申請號: | 201210191976.2 | 申請日: | 2012-06-11 |
| 公開(公告)號: | CN103488638A | 公開(公告)日: | 2014-01-01 |
| 發明(設計)人: | 宗朗;陳薇;王騰蛟;楊冬青 | 申請(專利權)人: | 北京大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京君尚知識產權代理事務所(普通合伙) 11200 | 代理人: | 俞達成 |
| 地址: | 100871*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 結果 緩存 替換 優化 方法 | ||
1.一種結果緩存替換的優化方法,其步驟為:
1)初始化一結果緩存空間;
2)讀取系統搜索日志,以系統搜索日志中的用戶ID為鍵、用戶發起的請求為鍵值建立一哈希表h2;
3)將同一用戶ID發起的所有請求進行拼接,得到一字符串;將每條字符串作為一個文檔,對所有用戶的拼接字符串構成的文檔集進行話題模型分析,獲得話題集合M及文檔與每個話題mi之間的關聯度pi;
4)計算一段時間內,與話題mi相關的搜索請求出現次數與這一時間段內所有請求出現次數的比值hi,根據比值hi和關聯度pi計算該請求的權重貢獻值,并將結果緩存存入結果緩存空間中,直到結果緩存空間存滿;
5)當收到一用戶請求q時,在結果緩存空間中查找匹配的結果緩存并返回和更新h2;如果沒有匹配結果緩存,則根據當前用戶請求q的用戶ID,在哈希表h2中查找對應的鍵值并與q拼接,計算q的權重貢獻值;如果哈希表h2中沒有對應的用戶ID,則將其作為新的項添加到h2,并計算q的權重貢獻值;
6)如果請求q對應結果緩存的權重小于緩存空間中當前權重最小的結果緩存的權重,則不緩存請求q的結果緩存;否則將請求q的結果緩存替換當前權重最小的結果緩存。
2.如權利要求1所述的方法,其特征在于所述步驟2)中,提取系統日志中頁面的URL,以URL為鍵、頁面點擊次數和頁面在結果中出現的次數為鍵值建立一哈希表h1。
3.如權利要求2所述的方法,其特征在于對于請求q,利用其結果緩存及用戶反饋,更新哈希表h1。
4.如權利要求3所述的方法,其特征在于對于請求q,將哈希表h1中的用戶點擊歸一化后,計算搜索結果質量重要度F1的值。
5.如權利要求1或4所述的方法,其特征在于采用公式計算比值hi,
其中,ti是指一段時間內出現與話題mi相關的搜索請求次數,n為話題總數。
6.如權利要求5所述的方法,其特征在于計算某一請求的權重貢獻值F2的公式為
7.如權利要求6所述的方法,其特征在于每一請求的結果緩存權重W為該請求緩存項權重、
該請求搜索結果質量重要度F1值、請求的權重貢獻值F2值三者之和。
8.如權利要求4所述的方法,其特征在于應用公式F1=1/(1-p1)*(1-p2)計算搜索質量重要度F1的值,p1為網頁在搜索日志結果中出現的次數比例、p2為網頁被用戶點擊的次數比例。
9.如權利要求1所述的方法,其特征在于采用LDA模型對文檔集進行話題模型分析,獲得話題集合M及文檔與每個話題mi之間的關聯度pi。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學,未經北京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210191976.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:計算系統和計算系統的執行控制方法
- 下一篇:網絡電子地圖信息處理方法





